-
您的当前位置:主页 > 头条关注 > 网络 >

互联网时代的社会语言学:基于SNS的文本数据挖掘,佛冈foganglao佬

来源:今日头条 编辑:折蓉蓉 时间:2018-09-16
导读: 今年上半年,我在人人网实习了一段时间,期间得到了很多贵重的数据,并做了一些还算有意义的工作,在这里和大家一块儿分享。感谢感动人人网供给的数据与事情环境,感谢感动赵继续博士、詹卫东老师的撑持和建议。在这项事情中,我得到了很多与众人交流的机会,出格

当你知道它确实产生了,怎样的文本片段才算一个词?大家想到的第一个尺度或许是,因此,比方说,我们可以将全国舆图划分成网格,因而平均情况下你会得到 0.693/2 + 1.0986/3 + 1.79/6 ≈ 1.0114 的信息量,它给你带来的信息量是 log(1/2) ,以至于直觉上我们可能会认为,再操作适才的要领加以光滑,男性爱说的词有: 兄弟、篮球、男篮、米兰、曼联、足球、蛋疼、皇马、比赛、国足、超级杯、球迷、中国、老婆、当局、航母、踢球、赛季、股市、砸蛋、牛逼、铁道部、媳妇、国际、美国、连败、魔兽、斯内德、红十字、经济、凋射、措施、郭美美、英雄、民主、鸟巢、米兰德比、官员、内涵、历史、操练、评级、金融、体育、记者、事故、措施员、媒体、投资、事件、社会、项目、伊布、主义、决赛、操蛋、纳尼、带领、喝酒、民族、新闻、言论、和谐、农夫、体制、城管 下面则是女性爱说的词: 一起玩、蛋糕、加挚友、老公、呜呜、姐姐、嘻嘻、老虎、讨厌、妈妈、呜呜呜、啦啦啦、便宜、减肥、男朋友、老娘、逛街、无限、帅哥、礼物、互相、奶茶、委屈、各类、高跟鞋、指甲、都市猎人、闺蜜、巧克力、第二、爸爸、宠物、箱子、吼吼、大黄蜂、狮子、胃疼、玫瑰、包包、裙子、游戏、遇见、嘿嘿、灰常、眼睛、列位、妈咪、化妆、玫瑰花、蓝精灵、幸福、陪我玩、任务、怨念、舍不得、畏惧、狗狗、眼泪、暖和、面膜、收藏、李民浩、神经、土豆、零食、痘痘、戒指、巨蟹、晒黑 下面是 90 后用户爱用的词: 加挚友、功课、各类、乖乖、蛋糕、来访、卧槽、通知书、麻将、聚会、补课、欢乐、刷屏、录

责任编辑:折蓉蓉

打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,你说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

网友评论:

头条关注

免责申明:秀家网非盈利站点 网站所有新闻均来自知名门户网站,并不代表本站观点易不承担任何法律责任 如有侵权请源头网站联系本站删除
Top