【我在 GitChat 写童话】是浅浅对啥基础都莫得的全年龄段读者的入门讲解,全系列通俗易懂,幽默风趣(可能叭),可能会配上精美的绘图,尽可能地不使用数学公式,只采用最接近大众受教育水平的讲解模式给读者们做科普,当然啦,全系列是保持童话的风格哦【也有可能是小说风格或者是小故事风格哈哈哈哈】。
【我在 GitChat 写童话】系列慢慢写哦,这是第一篇喽。
我们应该用一种容易理解的说法来讲述协同过滤,尽可能地采用普遍大众所能接受的用词用语来进行描述。使用专业的数学公式和术语对协同过滤进行讲解,是一件很 easy 的事情,可是这个世界上并不是所有人都能用专业的思维模式去思考问题,所以如何进行高效科普就成为了一件很难的事情。就好像,我们教小孩子 $1+1=2$ 很难,但是告诉一个初中生 $y+1=2$, 求 $y$ 的值就很简单,而现在,浅浅要做的事情就有点儿像是如何把类似 $1+y=2$ 可以推出 $y=1$,教授给小孩子们。
小白兔吃香蕉在一座寂静的森林里,住着好多好多动物,其中有老虎泰格、狮子莱恩、猴子芒奇、小白兔罗彼特、斑马泽布拉。小白兔罗彼特总是喜欢啃它红不拉叽叽的胡萝卜,有一天狮子莱恩跑到菜园子里跟罗彼特说:“小东西,咋还搁着吃红不拉叽叽呢?跟本王一起去吃肉吧,那味道可是美味极了!”。
小白兔罗彼特斜斜地瞪了他一眼:“莱恩大叔喜欢吃肉,跟那泰格小哥就是一伙的,我才不会跟你去咧,不然就被吃抹干净喽!”
泰格突然跳出来:“小白兔你可别瞎说,我跟莱恩大叔可没有搞那些花里胡哨的小动作。”
“就是就是!你这兔子肉还不够本王塞牙缝呢!本王好心来找你一起去吃肉,你却污蔑本王,呜呜呜,再也不和这小东西做好朋友了!”狮子莱恩很伤心地离开菜园子,它哭泣的模样惹得罗彼特非常内疚,但是罗彼特想想还是红不拉叽叽的胡萝卜好吃,就用同样的说辞把老虎泰格赶走了。
过了一会儿,从头顶上突然飘来五个字:“俺老孙来也!”猴子芒奇荡着树藤蹦蹦跳跳地来到罗彼特跟前,斑马泽布拉也来找小白兔罗彼特玩耍了,嘴里还叼着一撮路边的野草。
“早上好啊,我的铁憨憨阁下。”泽布拉开口就是一顿日常损话,“先前你总问我有啥好吃的,今天我发现一种特别好吃的东西,芒奇也很爱吃。但我想你应该从未尝过,所以给你带来瞅瞅。”泽布拉说完就从兜里掏出一根黄澄澄的香蕉,一股清香荡漾在菜园子上空。
“咦?这是什么好吃的?味道好香啊!”罗彼特放下手里红不拉叽叽的胡萝卜,从泽布拉手里接过黄澄澄的香蕉。猴子芒奇在旁边起哄:“赶紧试试,这味道很赞的!”
罗彼特心里想着:泽布拉是跟我一样吃素的,这猴子芒奇可不是,它什么都吃,是顶有名的啥都吃,他说好吃的东西,我不怎么相信。但是泽布拉说得就不一样了,我俩都吃素,他也经常跟我一起吃红不拉叽叽的胡萝卜,他说好吃的东西,想必很好吃,我尝尝好喽。
罗彼特心里一番斟酌之后,直接开吃。“哇……这也太涩了吧,呸呸呸!不好吃!”泽布拉从罗彼特手里拿来,把皮剥开,雪白的果肉就露出来了。“你再尝尝。”罗彼特咬了一口,心中想着:嗯!味道可以啊,还不错咧,没有刚刚那么难吃,果然相信泽布拉是正确的,要是换成芒奇,指不定现在怎么嘲笑我。
欢声笑语飘荡在菜园子里。
故事解读第一次采用儿童故事的方式讲述一个知识,是有些无可适从的,尤其是在一些用词和语句搭配上,哈哈哈哈哈哈,浅浅很难立刻把握到那种俏皮的说辞。但是幸不辱命,浅浅还是完成了这篇小故事的撰写。这个故事的核心在于加粗字体的位置。从小白兔罗彼特的内心思考中,我们已经发现了它正在对猴子芒奇和斑马泽布拉做出相似度评定。结果是猴子啥都吃,斑马和它一样吃素的。于是在它的心里,斑马和它的相似度是最高的,所以它接受了斑马的香蕉推荐。
协同过滤的本质和这个故事内的思考是一致的,首先计算用户之间的相似度,然后看看高于某个数值的相似用户有什么是值得推荐的高分项目。当然其中会使用很多很多的数学公式,有兴趣的话可以参考我的《个性化推荐系统学习总结》这篇文章展开进一步的学习。
那我们下一篇文章再见啦~
阅读全文: http://gitbook.cn/gitchat/activity/5ed4a4181f5e204b8ebad12f
您还可以下载 CSDN 旗下精品原创内容社区 GitChat App ,阅读更多 GitChat 专享技术内容哦。