您当前的位置: 首页 >  自然语言处理

不牌不改

暂无认证

  • 0浏览

    0关注

    422博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

【自然语言处理】潜在语义分析【下】概率潜在语义分析

不牌不改 发布时间:2022-10-18 20:55:15 ,浏览量:0

有任何的书写错误、排版错误、概念错误等,希望大家包含指正。 由于字数限制,分成两篇博客。 【自然语言处理】潜在语义分析【上】潜在语义分析 【自然语言处理】潜在语义分析【下】概率潜在语义分析

2. 概率潜在语义分析

概率潜在语义分析(probabilistic latent semantic analysis,PLSA),也称概率潜在语义索引(probabilistic latent semantic indexing,PLSI),是一种利用概率生成模型对文本集合进行话题分析的无监督学习方法。

2.1. 基本思想

给定一个文本集合,每个文本讨论若干个话题,每个话题由若干个单词表示。对文本集合进行概率潜在语义分析,就能够发现每个文本的话题,以及每个话题的单词。话题是不能从数据中直接观察到的,是潜在的。

文本集合转换为文本-单词共现数据,具体表现为单词-文本矩阵(如图 1 1

关注
打赏
1662186765
查看更多评论
立即登录/注册

微信扫码登录

0.0397s