您当前的位置: 首页 >  自然语言处理

不脱发的程序猿

暂无认证

  • 3浏览

    0关注

    492博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

自然语言处理常用数据集

不脱发的程序猿 发布时间:2018-11-24 14:03:11 ,浏览量:3

最近需要从文本中抽取结构化信息,收集到很多数据,遂整理了一下,后续会不断更新。

涉及内容包括:中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、历史名人词库、诗词词库、医学词库、饮食词库、法律词库、汽车词库、动物词库、中文聊天语料、中文谣言数据。

下载地址:https://download.csdn.net/download/m0_38106923/10804731

 

关注
打赏
1664101891
查看更多评论
立即登录/注册

微信扫码登录

0.3798s