Top 24 카카오톡 대화 분석 파이썬 The 103 Latest Answer

You are looking for information, articles, knowledge about the topic nail salons open on sunday near me 카카오톡 대화 분석 파이썬 on Google, you do not find the information you need! Here are the best content compiled and compiled by the toplist.prairiehousefreeman.com team, along with other related topics such as: 카카오톡 대화 분석 파이썬 카톡 분석기pc, 카톡 키워드 분석, 카카오톡 대화 내용 출력, 카카오 분석기, 카카오톡 오픈 챗 기록, 카카오톡 워드클라우드, 카 톡봇 소스, Eva_vh_listcontrol_dblclk


핫딜이 뜨면 카톡으로 알림! 파이썬 프로그래밍 (1/3)
핫딜이 뜨면 카톡으로 알림! 파이썬 프로그래밍 (1/3)


파이썬[Python] 추출된 카톡 대화에서 사람마다 말한횟수 카운팅 하기

  • Article author: appia.tistory.com
  • Reviews from users: 6429 ⭐ Ratings
  • Top rated: 3.5 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 파이썬[Python] 추출된 카톡 대화에서 사람마다 말한횟수 카운팅 하기 이번 포스팅은 카카오톡의 대화을 분석하는 방법에대해서 이야기를 해보고자 합니다. 게임을 하던지, 아니면 다른 업무를 하던지 카카오톡 단체대화를 … …
  • Most searched keywords: Whether you are looking for 파이썬[Python] 추출된 카톡 대화에서 사람마다 말한횟수 카운팅 하기 이번 포스팅은 카카오톡의 대화을 분석하는 방법에대해서 이야기를 해보고자 합니다. 게임을 하던지, 아니면 다른 업무를 하던지 카카오톡 단체대화를 … 파이썬[Python] 추출된 카톡 대화에서 사람마다 말한횟수 카운팅 하기 이번 포스팅은 카카오톡의 대화을 분석하는 방법에대해서 이야기를 해보고자 합니다. 게임을 하던지, 아니면 다른 업무를 하던지 카..
  • Table of Contents:

앱피아

파이썬[Python] 추출된 카톡 대화에서 사람마다 말한횟수 카운팅 하기 본문

파이썬[Python] 추출된 카톡 대화에서 사람마다 말한횟수 카운팅 하기

티스토리툴바

파이썬[Python] 추출된 카톡 대화에서 사람마다 말한횟수 카운팅 하기
파이썬[Python] 추출된 카톡 대화에서 사람마다 말한횟수 카운팅 하기

Read More

카톡 분석 : 파이썬

  • Article author: 95pbj.tistory.com
  • Reviews from users: 3182 ⭐ Ratings
  • Top rated: 3.1 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 카톡 분석 : 파이썬 재미를 목적으로 만든 카카오톡 대화 분석기입니다. 우리 단톡방은 언제 말이 많았고, 누가 어떤 말을 많이 사용하는지 알 수 있었네요. …
  • Most searched keywords: Whether you are looking for 카톡 분석 : 파이썬 재미를 목적으로 만든 카카오톡 대화 분석기입니다. 우리 단톡방은 언제 말이 많았고, 누가 어떤 말을 많이 사용하는지 알 수 있었네요. 재미를 목적으로 만든 카카오톡 대화 분석기입니다. 우리 단톡방은 언제 말이 많았고, 누가 어떤 말을 많이 사용하는지 알 수 있었네요. (개인신상과 관련된 부분은 가렸습니다.) 파이썬+주피터를 사용했습니다…관심사와 관련된 여러가지를 다룹니다.
  • Table of Contents:

카톡 분석 파이썬

코드

티스토리툴바

카톡 분석 : 파이썬
카톡 분석 : 파이썬

Read More

[파이썬] 카카오톡 대화 내용 분석 2: 대화방에서 가장 많이 사용되는 단어 — is this it

  • Article author: is-this-it.tistory.com
  • Reviews from users: 19956 ⭐ Ratings
  • Top rated: 3.7 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about [파이썬] 카카오톡 대화 내용 분석 2: 대화방에서 가장 많이 사용되는 단어 — is this it 카카오톡 PC에서 대화 내용을 내보내기하여 받은 .txt 파일을 분석한다. 추출한 챗 로그 텍스트 파일은 2019년 11월 기준으로 아래처럼 생겼다. …
  • Most searched keywords: Whether you are looking for [파이썬] 카카오톡 대화 내용 분석 2: 대화방에서 가장 많이 사용되는 단어 — is this it 카카오톡 PC에서 대화 내용을 내보내기하여 받은 .txt 파일을 분석한다. 추출한 챗 로그 텍스트 파일은 2019년 11월 기준으로 아래처럼 생겼다. 카카오톡 PC에서 대화 내용을 내보내기하여 받은 .txt 파일을 분석한다. 추출한 챗 로그 텍스트 파일은 2019년 11월 기준으로 아래처럼 생겼다. 몇 년 전과 달라졌다. 대화방에서 많이 사용..
  • Table of Contents:

블로그 메뉴

공지사항

인기 글

태그

최근 댓글

최근 글

티스토리

[파이썬] 카카오톡 대화 내용 분석 2: 대화방에서 가장 많이 사용되는 단어 — is this it
[파이썬] 카카오톡 대화 내용 분석 2: 대화방에서 가장 많이 사용되는 단어 — is this it

Read More

Python으로 단톡방 채팅 내용 키워드 분석하기 — 엘레베이터에 낀 남자

  • Article author: nookpi.tistory.com
  • Reviews from users: 19846 ⭐ Ratings
  • Top rated: 4.5 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about Python으로 단톡방 채팅 내용 키워드 분석하기 — 엘레베이터에 낀 남자 단톡방 대화내용 확보; 대화내용을 화자별로 구분하여 저장; 각 문장에서 단어를 추출하여 사용 빈도가 높은 순서대로 정렬. PC카톡 기준. …
  • Most searched keywords: Whether you are looking for Python으로 단톡방 채팅 내용 키워드 분석하기 — 엘레베이터에 낀 남자 단톡방 대화내용 확보; 대화내용을 화자별로 구분하여 저장; 각 문장에서 단어를 추출하여 사용 빈도가 높은 순서대로 정렬. PC카톡 기준. 일정이 붕 떠서 심심하던 차에, 문득 친구들이랑 떠드는 단톡방이나 한 번 까보고 싶어졌다. 하려는 일의 순서는 다음과 같다. 단톡방 대화내용 확보 대화내용을 화자별로 구분하여 저장 각 문장에서 단어를 추출..
  • Table of Contents:

블로그 메뉴

공지사항

인기 글

태그

최근 댓글

최근 글

티스토리

Skin by hELLO

티스토리툴바

Python으로 단톡방 채팅 내용 키워드 분석하기 — 엘레베이터에 낀 남자
Python으로 단톡방 채팅 내용 키워드 분석하기 — 엘레베이터에 낀 남자

Read More

파이썬 크롤링(웹스크래핑) – 카톡 대화 워드클라우드로 만들기 :: 크리에이터의 추월차선

  • Article author: creatorjo.tistory.com
  • Reviews from users: 35816 ⭐ Ratings
  • Top rated: 4.2 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 파이썬 크롤링(웹스크래핑) – 카톡 대화 워드클라우드로 만들기 :: 크리에이터의 추월차선 오늘은 ‘파이썬으로 카카오톡 대화 내용을 읽고 편집하여 워드 … 비속어가 몇 번 나오는지도 분석할 수 있고, 친구 관계도 분석해볼 수 있고, … …
  • Most searched keywords: Whether you are looking for 파이썬 크롤링(웹스크래핑) – 카톡 대화 워드클라우드로 만들기 :: 크리에이터의 추월차선 오늘은 ‘파이썬으로 카카오톡 대화 내용을 읽고 편집하여 워드 … 비속어가 몇 번 나오는지도 분석할 수 있고, 친구 관계도 분석해볼 수 있고, … 스파르타 코딩 파이썬 혼자 놀기 패키지 3일차! 오늘은 ‘파이썬으로 카카오톡 대화 내용을 읽고 편집하여 워드 클라우드로 만드는 것!’을 배웠다. 강의 내용을 정리하기 전, 다시 한 번 알게된 어마어마한 사실이..부지런히 꾸준히 적자생존!!
  • Table of Contents:
파이썬 크롤링(웹스크래핑) - 카톡 대화 워드클라우드로 만들기 :: 크리에이터의 추월차선
파이썬 크롤링(웹스크래핑) – 카톡 대화 워드클라우드로 만들기 :: 크리에이터의 추월차선

Read More

PC 카카오톡 오픈채팅 대화분석기 – 카카오 오톡팍 ver 1.0.0 : 네이버 블로그

  • Article author: blog.naver.com
  • Reviews from users: 12927 ⭐ Ratings
  • Top rated: 4.1 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about PC 카카오톡 오픈채팅 대화분석기 – 카카오 오톡팍 ver 1.0.0 : 네이버 블로그 1.카카오톡 PC 버전에서 해당 오픈채팅방 대화 내보기를 합니다. ※ 모바일 버전 불가능!! ※ 모든 기준은 대화내용 파일이므로. 최초 생성한 방장 및 대화 … …
  • Most searched keywords: Whether you are looking for PC 카카오톡 오픈채팅 대화분석기 – 카카오 오톡팍 ver 1.0.0 : 네이버 블로그 1.카카오톡 PC 버전에서 해당 오픈채팅방 대화 내보기를 합니다. ※ 모바일 버전 불가능!! ※ 모든 기준은 대화내용 파일이므로. 최초 생성한 방장 및 대화 …
  • Table of Contents:

악성코드가 포함되어 있는 파일입니다

작성자 이외의 방문자에게는 이용이 제한되었습니다

PC 카카오톡 오픈채팅 대화분석기 - 카카오 오톡팍 ver 1.0.0 : 네이버 블로그
PC 카카오톡 오픈채팅 대화분석기 – 카카오 오톡팍 ver 1.0.0 : 네이버 블로그

Read More

[PC 카카오톡 오픈채팅 대화분석기 Demo 버전] 카카오 오톡팍 – 사용설명서

  • Article author: monoworld-1.tistory.com
  • Reviews from users: 998 ⭐ Ratings
  • Top rated: 3.9 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about [PC 카카오톡 오픈채팅 대화분석기 Demo 버전] 카카오 오톡팍 – 사용설명서 [PC 카카오톡 오픈채팅 대화분석기 Demo 버전] 카카오 오톡팍 – 사용설명서. 모노원호 2021. 2. 26. 21:27. 320×100. …
  • Most searched keywords: Whether you are looking for [PC 카카오톡 오픈채팅 대화분석기 Demo 버전] 카카오 오톡팍 – 사용설명서 [PC 카카오톡 오픈채팅 대화분석기 Demo 버전] 카카오 오톡팍 – 사용설명서. 모노원호 2021. 2. 26. 21:27. 320×100. 정식 프로그램이 등록되었습니다. https://cafe.naver.com/ArticleRead.nhn?clubid=21788511&menuid=59&boardtype=L&page=1&specialmenutype=&userDisplay=15&articleid=1924 다운로드 : https://cafe.naver.com/..
  • Table of Contents:

태그

관련글

댓글2

전체 방문자

티스토리툴바

[PC 카카오톡 오픈채팅 대화분석기 Demo 버전] 카카오 오톡팍 - 사용설명서
[PC 카카오톡 오픈채팅 대화분석기 Demo 버전] 카카오 오톡팍 – 사용설명서

Read More

3. 저장된 txt 파일은 어떻게 정제해야 할까? 1편 :: 이것저것 알아보는

  • Article author: bces.tistory.com
  • Reviews from users: 26984 ⭐ Ratings
  • Top rated: 3.7 ⭐
  • Lowest rated: 1 ⭐
  • Summary of article content: Articles about 3. 저장된 txt 파일은 어떻게 정제해야 할까? 1편 :: 이것저것 알아보는 내보내기 된 카카오톡 오픈 채팅방.txt 내용 1 내보내기 된 카카오톡 오픈 채팅방.txt … 데이터분석 QnA&네트워킹 님과 카카오톡 대화 저장한 날짜 … …
  • Most searched keywords: Whether you are looking for 3. 저장된 txt 파일은 어떻게 정제해야 할까? 1편 :: 이것저것 알아보는 내보내기 된 카카오톡 오픈 채팅방.txt 내용 1 내보내기 된 카카오톡 오픈 채팅방.txt … 데이터분석 QnA&네트워킹 님과 카카오톡 대화 저장한 날짜 … 먼저 저장된 txt 파일은 아래처럼 구성된다. 위 설명에 맞춘 정제 포인트는 아래와 같다. 기본 헤더 제거 일별 구분 첫 입장 메시지 제거 작성자/기준시간/작성 메시지 분리하기 입장, 퇴장 확인하기 1. 정제 전..
  • Table of Contents:

3 저장된 txt 파일은 어떻게 정제해야 할까 1편

티스토리툴바

3. 저장된 txt 파일은 어떻게 정제해야 할까? 1편 :: 이것저것 알아보는
3. 저장된 txt 파일은 어떻게 정제해야 할까? 1편 :: 이것저것 알아보는

Read More


See more articles in the same category here: https://toplist.prairiehousefreeman.com/blog/.

파이썬[Python] 추출된 카톡 대화에서 사람마다 말한횟수 카운팅 하기

반응형

파이썬[Python] 추출된 카톡 대화에서 사람마다 말한횟수 카운팅 하기

파이썬[Python] 추출된 카톡 대화에서 사람마다 말한횟수 카운팅 하기

이번 포스팅은 카카오톡의 대화을 분석하는 방법에대해서 이야기를 해보고자 합니다. 게임을 하던지, 아니면 다른 업무를 하던지 카카오톡 단체대화를 많이 사용합니다. 이럴 경우, 카카오톡에서 대화를 추출하여 분석작업을 하곤 합니다. 그래서 이번 포스팅에서는 카카오톡에서 추출된 대화를 바탕으로 사용자마다 몇회 이야기를 했는지에 대해서 분석해보도록 하겠습니다.

먼저 다음 포스팅을 하기 위해서는 카카오톡 대화를 추출하셔야 합니다. 관련해서는 다음 링크에보이는 부분을 참조하여 주시길 바랍니다.

[윈도우10 Windows10]카카오톡 대화방 대화내용 추출하기

그럼 먼저 대화를 추출하시면 다음과 같은 화면을 볼 수 있습니다.

카카오톡 대화 내용 추출 결과

보시는 바와 같이 다음과 같은 형태로 대화가 추출이됩니다.

[아이디] [시간] 내용

그럼 위의 부분을 바탕으로 파일로 추출되어 있는 카카오톡 내용을 추출해보도록 하겠습니다. 먼저 전체 코드를 살펴보겠습니다.

import re def reading_source(path): list = [] listv = {} sourcecode = open(path,”r+”, encoding=’utf-8′) data=sourcecode.readlines() condition = 0 for idata in data : if idata[0] ==”[” : name = idata.split(‘]’) name = name[0][1:] print(name) if name not in list: print(name + ” 추가되었습니다.”) list.append(name) listv[name]= 1 else : listv[name] = listv[name] +1 for i in listv : print(i +”\t” + str(listv[i])) print(listv) if __name__ == ‘__main__’: mylist = r”C:\Users\Appia\Desktop\0820.txt” reading_source(mylist)

먼저 파일을 불러와서, 파일을 realines을 이용하여 각 내용을 줄단위로 읽어옵니다. 그런 후에 첫 부분이 “[“부분을 선별하고, 그런후에 “]”기반으로 분리합니다. 그럼 첫번째 맴버가 다음과 같은 형태가 될 것입니다.

[아이디

이 때 name[0][1:] 부분을 이용하여 이름을 추출합니다. 그런후에 이름 여부를 확인하여 딕셔너리에 선언하고 그렇지 않을 경우에 해당 name부분을 키로 이용하여 해당 값에 1을 추가해줍니다.

list = [] … if name not in list: # 리스트 포함 여부 확인 (없을 경우) print(name + ” 추가되었습니다.”) list.append(name) # 리스트 맴버 추가 listv[name]= 1 #딕서너리 값 추가 else : listv[name] = listv[name] +1 (해당 이름이 존재하면 그쪽으로 값을 한개씩 추가)

이와 같은 방법으로 해당 코드를 카운트를 하게 됩니다. 그런 결과를 보면 다음과 같은 결과를 얻을 수 있습니다.

결과

이와 같이 각 아이디마다 사람수의 카톡이 명시가 됩니다.

[윈도우10 Windows10]카카오톡 대화방 대화내용 추출하기

이번 포스팅에서는 파이썬[Python] 추출된 카톡 대화에서 사람마다 말한횟수 카운팅 하기라는 주제로간단히 포스팅을해봤습니다. 단체카톡이나, 단체톡에 내용에 대해서 사용해보면 약간의 재미를 느낄 수 있습니다. 혹 궁금하신 점이나 무의 사항이 있으시면 언제든지 댓글 및 방명록에 글 남겨주시길 바랍니다.

반응형

카톡 분석 : 파이썬

반응형

재미를 목적으로 만든 카카오톡 대화 분석기입니다.

우리 단톡방은 언제 말이 많았고, 누가 어떤 말을 많이 사용하는지 알 수 있었네요.

(개인신상과 관련된 부분은 가렸습니다.)

파이썬+주피터를 사용했습니다.

카카오톡 단톡방 분석

분석 목차

연도별 메시지 개수

월별 메시지 개수

요일별 메시지 개수

시간별 메시지 개수

중간 정리

보낸 사람 별 메시지 개수

이모티콘 사용 순위

사진 보내기 순위

욕설 순위

욕설 순위2

욕설 순위3

감탄 순위

웃음 순위

눈물 순위

강조 순위

의문 순위

코드

카카오톡의 대화내용 내보내기 기능을 이용하여 추출한 csv파일을 이용했습니다.

#!/usr/bin/env python # coding: utf-8 # # 카카오톡 대화 분석기 # # In[ ]: import pandas as pd import numpy as np import matplotlib.pyplot as plt get_ipython().run_line_magic(‘matplotlib’, ‘inline’) import locale locale.setlocale(locale.LC_ALL, ‘ko_KR.UTF-8’) # In[ ]: df=pd.read_csv(“talk.csv”) # In[ ]: df.head() # ## 전처리 # – Date 변수 나누기 # – 시스템 메시지 제거 # – 초대했습니다. # – 나갔습니다. # – 결측값 처리 # ### Date 변수 나누기 # # In[ ]: df[“Date”]=df[“Date”].astype(“datetime64”) df[“year”]=df[“Date”].dt.year df[“month”]=df[“Date”].dt.month df[“day”]=df[“Date”].dt.day df[“hour”]=df[“Date”].dt.hour df[‘weekday’]=df[“Date”].dt.strftime(“%A”) # ### 시스템 메시지 제거 # In[ ]: df=df[~df[“Message”].str.contains(“invited”)] df=df[~df[“Message”].str.contains(“나갔습니다.”)] # ### 결측값 제거 # In[ ]: df.isnull().sum() # In[ ]: df[“User”]=df[“User”].fillna(“(알 수 없음)”) # ## 분석 # 기간 : 2014-02-13 ~ 2019-08-23(약 6년) # 메시지 개수 : 213,047건 # – 날짜 # – 연도별 메시지 개수 # – 월별 메시지 개수 # – 요일별 메시지 개수 # – 시간별 메시지 개수 # – 내용 # – 보낸 사람별 메시지 개수 # – 이모티콘 사용 순위 # – 사진 보내기 순위 # – 욕설 순위 # – ㅅㅂ # – ㅂㅅ # – ㅁㅊ # – 감탄 순위 # – 우와 # – 웃음 순위 # – ㅋ # – 눈물 순위 # – ㅠ # – 강조 순위 # – ! # – 의문 순위 # – ? # # – ㅋㅋ이 가장 많은 대화(예정) # # ### 날짜 # #### 연도별 메시지 개수 # In[ ]: df.groupby(“year”)[“Message”].count() # In[ ]: df.groupby(“year”)[“Message”].count().plot(kind=”pie”) # #### 월별 메시지 개수 # In[ ]: df.groupby(“month”)[“Message”].count() # In[ ]: df[df[“year”]==2014].groupby(“month”)[“Message”].count().plot(kind=”pie”); # In[ ]: df[df[“year”]==2019].groupby(“month”)[“Message”].count().plot(kind=”pie”); # #### 요일별 메시지 개수 # In[ ]: df.groupby(“weekday”)[“Message”].count().sort_values(ascending=False) # In[ ]: df[df[“year”]==2014].groupby(“weekday”)[“Message”].count().sort_values(ascending=False).plot(“pie”); # In[ ]: df[df[“year”]==2019].groupby(“weekday”)[“Message”].count().sort_values(ascending=False).plot(“pie”); # #### 시간별 메시지 개수 # In[ ]: df.groupby(“hour”)[“Message”].count() # In[ ]: df[df[“year”]==2014].groupby(“hour”)[“Message”].count().plot(“pie”); # In[ ]: df[df[“year”]==2019].groupby(“hour”)[“Message”].count().plot(“pie”); # ### 내용 # #### 보낸사람별 메시지 개수 # In[ ]: df.groupby(“User”)[“Message”].count().sort_values(ascending=False) # In[ ]: df.groupby(“User”)[“Message”].count().sort_values(ascending=True)[-11:].plot(kind=”barh”,grid=True); # #### 이모티콘 사용 순위 # In[ ]: df[df[“Message”]==”이모티콘”].groupby(“User”)[“Message”].count().sort_values(ascending=False)[:10] # In[ ]: df[df[“Message”]==”이모티콘”].groupby(“User”)[“Message”].count().sort_values(ascending=True)[-11:].plot(kind=”barh”,grid=True); # #### 사진 보내기 순위 # In[ ]: df[df[“Message”]==”사진”].groupby(“User”)[“Message”].count().sort_values(ascending=False)[:10] # In[ ]: df[df[“Message”]==”사진”].groupby(“User”)[“Message”].count().sort_values(ascending=True)[-11:].plot(kind=”barh”,grid=True); # #### 욕설 순위 # ##### ㅅㅂ # In[ ]: df[(df[“Message”].str.contains(“ㅅㅂ”))|(df[“Message”].str.contains(“시발”)) ].groupby(“User”)[“Message”].count().sort_values(ascending=False)[:5] # In[ ]: df[(df[“Message”].str.contains(“ㅅㅂ”))|(df[“Message”].str.contains(“시발”)) ].groupby(“User”)[“Message”].count().sort_values(ascending=True)[-10:].plot(kind=”barh”,grid=True); # ##### ㅂㅅ # In[ ]: df[(df[“Message”].str.contains(“ㅂㅅ”))|(df[“Message”].str.contains(“병신”))].groupby(“User”)[“Message”].count().sort_values(ascending=False)[:5] # In[ ]: df[(df[“Message”].str.contains(“ㅂㅅ”))|(df[“Message”].str.contains(“병신”)) ].groupby(“User”)[“Message”].count().sort_values(ascending=True)[-10:].plot(kind=”barh”,grid=True); # ##### ㅁㅊ # In[ ]: df[(df[“Message”].str.contains(“ㅁㅊ”))|(df[“Message”].str.contains(“미친”))].groupby(“User”)[“Message”].count().sort_values(ascending=False)[:5] # In[ ]: df[(df[“Message”].str.contains(“ㅁㅊ”))|(df[“Message”].str.contains(“미친”)) ].groupby(“User”)[“Message”].count().sort_values(ascending=True)[-11:].plot(kind=”barh”,grid=True); # #### 감탄 순위 # ##### 우와 # In[ ]: df[df[“Message”].str.contains(“우와”)].groupby(“User”)[“Message”].count().sort_values(ascending=False)[:5] # In[ ]: df[df[“Message”].str.contains(“우와”)].groupby(“User”)[“Message”].count().sort_values(ascending=True)[-11:-1].plot(kind=”barh”,grid=True); # #### 웃음 순위 # ##### ㅋ # In[ ]: df[df[“Message”].str.contains(“ㅋ”)].groupby(“User”)[“Message”].count().sort_values(ascending=False)[:10] # In[ ]: df[df[“Message”].str.contains(“ㅋ”)].groupby(“User”)[“Message”].count().sort_values(ascending=True)[-11:-1].plot(kind=”barh”,grid=True); # ##### ㅎ # In[ ]: df[df[“Message”].str.contains(“ㅎ”)].groupby(“User”)[“Message”].count().sort_values(ascending=False)[:10] # In[ ]: df[df[“Message”].str.contains(“ㅎ”)].groupby(“User”)[“Message”].count().sort_values(ascending=True)[-11:-1].plot(kind=”barh”,grid=True); # #### 눈물 순위 # ##### ㅠ # In[ ]: df[df[“Message”].str.contains(“ㅠ”)].groupby(“User”)[“Message”].count().sort_values(ascending=False)[:10] # In[ ]: df[df[“Message”].str.contains(“ㅠ”)].groupby(“User”)[“Message”].count().sort_values(ascending=True)[-11:-1].plot(kind=”barh”,grid=True); # ##### ㅜ # In[ ]: df[df[“Message”].str.contains(“ㅜ”)].groupby(“User”)[“Message”].count().sort_values(ascending=False)[:10] # In[ ]: df[df[“Message”].str.contains(“ㅜ”)].groupby(“User”)[“Message”].count().sort_values(ascending=True)[-11:-1].plot(kind=”barh”,grid=True); # #### 강조 순위 # ##### ! # In[ ]: df[df[“Message”].str.contains(“!”)].groupby(“User”)[“Message”].count().sort_values(ascending=False)[:10] # In[ ]: df[df[“Message”].str.contains(“!”)].groupby(“User”)[“Message”].count().sort_values(ascending=True)[-11:-1].plot(kind=”barh”,grid=True); # #### 의문 순위 # ##### ? # In[ ]: df[df[“Message”].str.contains(“\?”)].groupby(“User”)[“Message”].count().sort_values(ascending=False)[:10] # In[ ]: df[df[“Message”].str.contains(“\?”)].groupby(“User”)[“Message”].count().sort_values(ascending=True)[-11:-1].plot(kind=”barh”,grid=True); # ### 번외 # #### 사과 순위 # In[ ]: df[df[“Message”].str.contains(“미안”)].groupby(“User”)[“Message”].count().sort_values(ascending=True)[-11:].plot(kind=”barh”,grid=True); # #### 존나 순위 # In[ ]: df[(df[“Message”].str.contains(“ㅈㄴ”))|(df[“Message”].str.contains(“존나”)) ].groupby(“User”)[“Message”].count().sort_values(ascending=True)[-11:].plot(kind=”barh”,grid=True); # #### 감사 순위 # In[ ]: df[(df[“Message”].str.contains(“ㄱㅅ”))|(df[“Message”].str.contains(“감사”))|(df[“Message”].str.contains(“고마워”))|(df[“Message”].str.contains(“고맙”)) ].groupby(“User”)[“Message”].count().sort_values(ascending=True)[-11:].plot(kind=”barh”,grid=True); # #### 굿 순위 # In[ ]: df[df[“Message”].str.contains(“굿”)].groupby(“User”)[“Message”].count().sort_values(ascending=True)[-11:].plot(kind=”barh”,grid=True);

자유롭게 사용하시고

도움이 되었다면 공감이나 댓글 부탁드립니다!

반응형

[파이썬] 카카오톡 대화 내용 분석 2: 대화방에서 가장 많이 사용되는 단어

반응형

카카오톡 PC에서 대화 내용을 내보내기하여 받은 .txt 파일을 분석한다.

추출한 챗 로그 텍스트 파일은 2019년 11월 기준으로 아래처럼 생겼다. 몇 년 전과 달라졌다.

대화방에서 많이 사용되는 단어를 띄어쓰기를 기준으로 split하여 추출하기 때문에, 단어 뒤에 조사가 주로 붙는 한국어에 아주 적합한 코딩은 아니다.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 # Most Frequently Used Words import re from collections import Counter words = [] open (r ‘C:\Users\카카오톡 대화 내용 텍스트 파일.txt’ ‘r’ , encoding = ‘utf-8’ ) as f: with(r, encoding) as f: for line in f: = re.search(r “^.*?\[\d\d:\d\d\]\s*(.+)$” , line) , line) if m: words.extend(re.split(r “\s+” , m.group( 1 ))) , m.group())) for word, freq in Counter(words).most_common( 10 ): print ( “{0:10s} : {1:3d}” . format (word, freq))

결과 예는 아래와 같다.

1 2 3 4 5 6 7 8 9 10 ㅋㅋ : 471 아 : 351 근데 : 334 ㅋㅋㅋ : 261 ㄹㅇ : 260 ㅇㅇ : 250 Photo : 207 ㅋㅋㅋㅋㅋ : 199 난 : 191 ㅋㅋㅋㅋ : 178

+ 2020년 4월 기준, 채팅 내용(메모장 파일)에서 시간 부분이 ‘[12:51]’에서 ‘[오전 12:51]’ 형식으로 바뀜.

이에 따라 정규표현식을 “^\[(.+\]?)\[\w+.\d\d:\d\d\]\s*.+$” 로 수정해야함

반응형

So you have finished reading the 카카오톡 대화 분석 파이썬 topic article, if you find this article useful, please share it. Thank you very much. See more: 카톡 분석기pc, 카톡 키워드 분석, 카카오톡 대화 내용 출력, 카카오 분석기, 카카오톡 오픈 챗 기록, 카카오톡 워드클라우드, 카 톡봇 소스, Eva_vh_listcontrol_dblclk

Leave a Comment