- 【大数据】蔬菜价格分析(QDU)
- 【大数据】美国新冠肺炎疫情分析——错误版(QDU)
- 【大数据】美国新冠肺炎疫情分析——正确版(QDU)
- 【大数据】乳腺癌预测——老师给的链接(QDU)
- 由于kaggle上“猫狗大战”的测试集标签是错的,所以没做出来,用的github上的代码
- 【大数据】《红楼梦》作者分析(QDU)
《红楼梦》是我国著名的四大名著之一,一般的认为《红楼梦》的前八十回为曹雪芹撰写,后四十回为高鹗续写,但也有学者对此并不认可。
一般来说,不同的作者往往会具有不同的写作风格,这些风格可以通过在文中的虚词的频率进行衡量,因此,可以考虑统计各章中虚词出现频率,并以此作为基础数据来聚类分析,对《红楼梦》章节进行划分,从而分析章节与作者之间的关系。
解决思路对比三种方式“K-Mean