As·phi·er

简称sp
物理加利福尼亚人
精神斯特拉斯堡人

【爱丽舍】用大数据分析法国&德国外交部自20年4月21日至22年2月9日的全部推文

#是点文,要求是《婚姻日常时政疫情笑话甜》。

#我非常擅长扭曲人类的愿望。

——

datasets:推特法国外交部英文版(@francediplo_en)与德国外交部英文版(@germanydiplo)自20年4月21日至22年2月9日的全部原创推特,法1939条,德1632条。数据来自followersanalysis。

tools:R,特别是tidytext这个包。有参考Text Mining with R这本书。

disclaimer:大家看个乐子就可以了。

——

1. 两国外交部发推频率

(红色代表法国,蓝色代表德国,下同)



2. 单词出现频率对比


举个例子:“minister”这个单词在德国外交部原创推文中出现频率约为1%,而在法国外交部原创推文中出现不到1%。


3. 谁更有可能说某个词?


举个例子:对法国来说,“#eu2022fr”这个单词较德国常用得多。而对德国来说,“#eu2020de”较法国常用得多。


4. 某些单词使用频率随时间的变化




5. 提到个别国家名字的推文数



举个例子:德国外交部一共有426条推文提到了“Germany”或“German”,324条推文提到了“EU”。


6. 提到个别国家名字的推文数占总推文比例



7. 根据德国所有提到法国的推文所制作的wordcloud



8. 根据法国所有提到德国的推文所制作的wordcloud



9. 互相提到对方的推文单词出现频率对比



10. 在互相提到对方的推文中,谁更有可能说某个词?



彩蛋里是德国外交部所有提到俄罗斯的推文的wordcloud与法国外交部所有提到英国的推文的wordcloud。


评论(17)

热度(467)

  1. 共33人收藏了此文字
只展示最近三个月数据