在今年3月份的,就看到这个帖子《东风何处是人间》了,对宋词进行分词计数,当时就保存了这个帖子,想以后有时间写个ruby版的。后来就忘记了近期这个帖子大火啊,也终于抽出时间写ruby版的了。个人水平有限,程序写的很糟糕,至少比原文的看着复杂多了,不知道是否能有ruby高手给大家写个示例。数据:《全宋词》文本#coding:utf-8require"iconv"s1=Iconv.conv'gbk','utf-8',","s2=Iconv.conv'gbk','utf-8',"。"s3=Iconv...
查看全文