您当前的位置: 首页 > 

庄小焱

暂无认证

  • 2浏览

    0关注

    805博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

思考问题总结与发现

庄小焱 发布时间:2021-07-06 16:11:17 ,浏览量:2

  1. 衡量相似度的计算有多种方式,比如计算余弦相似度、皮尔森相关系数、Jaccard相似系数等等,或者通过计算欧几里得距离、曼哈顿距离、明可夫斯基距离等方式计算相似度。余弦相似度是一种简单好用的向量相似度计算方式,通过计算向量之间的夹角余弦值来评估他们的相似度,本节我们使用余弦相似度计算特征之间的相似度。在不同的场景下使用的不懂的有利于的完成更好的推荐的功能,这个科研工作的一个热点方向。那么在复杂场景下的采用的是什么样的一种的相似度的计算方法呢?
  2. 矩阵的升维操作的原理是什么,作用是什么?怎么样做?为了什么?

神经网络处理文本数据时,需要用数字代替文本,Embedding层则是将输入数字数据映射成了高维向量,然后就可以使用卷积、全连接、LSTM等网络层处理数据了,接下来我们开始设计用户和电影数据的特征提取网络。

  1. LSTM 处理的是简单的文本信息,但是如果是复杂文本信息呢?需要用什么网络处理?
  2. 矩阵设计成为多少维度这个是没有固定的计算方法,需要依据问题的复杂程度,训练样本量,特征的信息量等多方面信息探索出最有效的设计
  3. 特征融合是一种常用的特征增强手段,通过结合不同特征的长处,达到取长补短的目的。简单的融合方法有:特征(加权)相加、特征级联、特征正交等等(复杂的特征融合的方法会的有哪些的,或者是在不同的领域的中的使用特征的方式有哪一些?)。此处使用特征融合是为了将用户的多个特征融合到一起,用单个向量表示每个用户,更方便计算用户与电影的相似度。上文使用Embedding加全连接的方法,分别得到了用户ID、年龄、性别、职业的特征向量,可以使用全连接层将每个特征映射到固定长度,然后进行相加,得到融合特征。
关注
打赏
1657692713
查看更多评论
立即登录/注册

微信扫码登录

0.0508s