首页 南方天气预报正文

网上举报,怎么继续进化自己?不断与对手协作!-雷火电竞网站

admin 南方天气预报 2019-08-13 162 0

内容来历:本文为中信出书集团出书书本《智能机器怎么考虑:深度神经网络的隐秘》读书笔记,笔记侠作为协作方,经出书社授权发布。

作者简介:肖恩·格里什,谷歌前工程专家,普林斯顿大学机器学习博士、机器学习极客,

曾在高频买卖组织泰莎科技担任工程师,并在谷歌担任机器学习和数据科学团队的工程专家。

封面设计 &责编| 马畅

第 3983 篇深度好文:4922 字 | 10 分钟阅览

内容来历:本文为中信出书集团出书书本《智能机器怎么考虑:深度神经网络的隐秘》读书笔记,笔记侠作为协作方,经出书社授权发布。

作者简介:肖恩·格里什,谷歌前工程专家,普林斯顿大学机器学习博士、机器学习极客,

曾在高频买卖组织泰莎科技担任工程师,并在谷歌担任机器学习和数据科学团队的工程专家。

封面设计 &责编| 马畅

第 3983 篇深度好文:4922 字 | 10 分钟阅览

读书笔记·精华笔记•文化生活

本文优质度:★★口感:汉堡肉

笔记君邀您,阅览前先考虑

  • 网飞是怎么完结打破的?

  • 怎么点评网飞找到打破的办法?

网飞是怎么完结打破的?

怎么点评网飞找到打破的办法?

一、百万美元大奖

2006年,当机器人团队正忙于为来年的DARPA城市挑战赛预备赛车时,网飞也向新式的数据科学界发布了自己的大奖。

网飞期望找到能够创立“电影引荐引擎”的团队,愿意向最优异的团队奖赏100万美元奖金。

当网飞发布公告时,他们的流媒体视频事务还不存在,公司的事务是供给DVD(数字通用光盘)租借服务。

用户能够向网飞讨取DVD,网飞会把DVD邮递给他们。但顾客需求抛弃一张其时持有的DVD才干收到下一张,而且新DVD需求几天后才干收到。

糟糕的挑选或许会让人错失观影的黄金时刻,因而用户往往很慎重地提出他们的讨取恳求。这便是网飞想要电影引荐引擎的原因。

当网飞发布公告时,他们的流媒体视频事务还不存在,公司的事务是供给DVD(数字通用光盘)租借服务。

用户能够向网飞讨取DVD,网飞会把DVD邮递给他们。但顾客需求抛弃一张其时持有的DVD才干收到下一张,而且新DVD需求几天后才干收到。

糟糕的挑选或许会让人错失观影的黄金时刻,因而用户往往很慎重地提出他们的讨取恳求。这便是网飞想要电影引荐引擎的原因。

作为服务的一部分,网飞答应用户运用1星(最差)到5星(最佳)的整数等级对电影进行评分。网飞期望运用评分协助用户决议租哪部电影。

宣告竞赛后,网飞向研讨集体发布了一个数据集,其间包含着它们在1998——2005年收集的1亿个星级评分。

榜首个创造出算法引荐功率比网飞的高10%的团队,将能取得大奖。

这个数据集对全职的和业余的数据科学家而言都是天赐之物。他们兴味盎然地着手处理这个问题。

在一周中,一些团队就以1%的优势打败了网飞自己的引荐引擎。在一年内,有20000支部队报名参赛,其间约有2000支部队提交了参赛著作。

二、竞赛者们的相互协作

网飞奖的竞赛者良莠不齐,但有一个三人小组一向在排行榜上保持着强势位置,这个团队便是“贝尔科”。

它是由AT&T实验室的三位研讨科学家(其间一位在竞赛过程中换岗至yahoo)组成的,他们在网络和引荐体系范畴的专业知识使他们具有了研讨这个项目的优异技术。

另一个团队“ML@UToronto”由来自多伦多大学的一群闻名神经网络研讨人员组成。成员包含被广泛以为是神经网络之父的杰弗里•辛顿(Geoffrey Hinton)。

并非一切参赛者都具有博士学位。其间一个看似实力较弱的团队中只要三名本科生,他们是两名来自普林斯顿大学核算机科学专业的学生和他们的一名数学专业室友。

这两名核算机科学专业的学生很快就开端攻读顶尖的博士课程。这个超出预期的青年三人组以网飞在数据会集列出的榜首部电影《恐龙星球》来命名自己的团队。

乃至还有一些资格更浅的选手。终究,一个名为“有用主义理论”的二人团队呈现了。这个法裔加拿大人二人组一向用业余时刻做这个项目。

其间一人在他家的厨房里作业,从晚上9点一向到午夜;那时他的孩子们都在睡觉。由于在协同过滤范畴没有任何经历,所以他们都很谦善,自称是“两个毫无条理的家伙”。

参赛选手的人数还在添加,不计其数,其间包含来自看似彻底不同范畴——比方心理学——的人。

尽管这些团队在相互竞赛,但他们发现自己也在竞赛中相互协作。事实上,正如咱们即将看到的:

一个不肯意向其他团队学习并协作的团队,想在竞赛中取得成功简直是不或许的。

下面,咱们将来追寻其间几个团队的百万美元奖金探索之旅。

三、怎么练习分类器?

你或许想知道为什么我在这本书里参加有关电影引荐的章节。电影引荐引擎真的是人工智能的重大打破吗?

实践上,引荐引擎是一种算法,旨在捕捉人们的偏好,乃至能够很好地模仿人类的偏好;可是,正是偏好让咱们成为人类。

假如有人说,引荐引擎对咱们经济的影响,现已远远超越了主动驾驶轿车和国际象棋程序,这必定不是虚言。由于引荐引擎正在为在线商务供给动力。

我把网飞奖写入这本书还有一个更重要的原因。竞赛中发作的一些事,例如选手们怎么处理问题、运用了什么东西等,将直接影响咱们怎么看待这本书中的其他打破。

正如咱们即将看到的,这场竞赛中出现的许多主意简直触及咱们稍后将看到的每一个主题。

我把网飞奖写入这本书还有一个更重要的原因。竞赛中发作的一些事,例如选手们怎么处理问题、运用了什么东西等,将直接影响咱们怎么看待这本书中的其他打破。

正如咱们即将看到的,这场竞赛中出现的许多主意简直触及咱们稍后将看到的每一个主题。

假定,你正在修改一本名为《国际最佳儿童食谱》的烹饪书。你计划收集贝蒂妙厨(BettyCrocker)网站上的食谱,把适宜的食谱编入这本书中。

关于每个食谱,你都有一个简略的决议要做:应不应该把它编入烹饪书中?

答复这个问题的一种办法是,预备好你在网站上找到的每一个食谱,把它们做成食物给你的孩子品味,然后问询孩子的定见。

可是假如这个网站上有15000个食谱,那么即便每天测验9个新食谱并留下记载,你也要烹饪4年多。

假如不投入很多的时刻和精力,你怎么能承认哪些食谱合适孩子?

学习过机器学习的人会刻不容缓地告知你怎么处理这个问题:你能够练习一个分类器!

在机器学习范畴,分类器供给了一种办法来主动判别项目(比方食谱)是否归于某个类别,例如“合适孩子的食谱”,与之相对的便是“不合适孩子的食谱”。

要运用分类器完结这项使命,你首要需求承认食谱中有哪些特色能够区别它是否合适孩子。

此刻,你能够发挥创造力和判别力,但有些特色或许特别有助于做这种区别。

贝蒂妙厨网站上的用户能够供给食谱的星级评分,这些评分或许与孩子是否喜爱它们有关,因而你能够将这些评分作为区别特色之一。

你还期望挑选易于烹饪且易于了解的食谱,例如,食谱仅需少量几个过程或仅需少量几种食材;你或许还想考虑糖的克数(孩子一般喜爱糖)和蔬菜克数(孩子一般不喜爱蔬菜)。

在机器学习中,咱们把这些用于区别的特色称为特征。当咱们把这些特征组合成描绘食谱好坏的食谱评分时,奇特的工作就发作了。

组合它们的最简略的办法是选用加权均匀值,你能够假定本书中的其他分类器也是用这种办法组合特征的,咱们运用权重来总结每个特征在终究得分中的重要性。

为什么要用加权均匀值来组合这些特征?

这或许看起来很果断,你或许现已正确地猜到,机器学习研讨人员现已找到了上百万种将这些特征组合成分数的办法。

但这种办法简略直接,易于推理。到目前为止,它是构建本书中一切主动机的最重要的“核算东西”。

请记住,这仅仅一个构件。咱们期望它很简略,由于咱们要把它与其他构件组合起来,而且咱们期望能够了解咱们构建的东西。

也是用这种办法组合特征的,咱们运用权重来总结每个特征在终究得分中的重要性。

想要从加权均匀值中得到一个分类器,咱们只需挑选一个阈值,例如咱们将阈值设为“0”,将高于该阈值的一切食谱都称为好食谱,而将低于该阈值的称为坏食谱。

假如你运用机器学习来构建分类器,就需求运用数据核算每个特征的权重,而且要挑选阈值。

你能够给孩子预备一些食谱,并记载他们对每个食谱的喜爱程度,以此收集这些数据。

然后,你能够用核算学中的规范公式,依据这些数据预算权重。你或许在高中时看到过这个公式(而且很快就忘记了),你学会了在一张纸上用一些点(x,y)拟合最佳直线。这儿运用的是相同的公式,仅仅每个y坐标都对应多个x坐标。

一旦你用少量几个食谱(比方说,100个食谱而不是15000个食谱)来拟合这个分类器的权重,就能够让核算机运转这个分类器,以此猜测剩余的14900个食谱是好是坏。

依据这个分类器,你能够从15000个食谱中挑选出200个最好的食谱,然后测验一下,承认它们的确不错,保存最好的,这时便功德圆满了。

现在,有了构建分类器的技巧,让咱们回到网飞奖,看看咱们怎么运用分类器引荐电影。

四、竞赛的方针

网飞应该运用什么规范向观众引荐电影?引荐电影的方针应该是什么呢?

2008 年,克莱夫·汤普森(CliveThompson)在为《纽约时报》编撰的一篇文章中探讨了这些问题。

其时竞赛正在进行中,他问道:

网飞的电影引荐服务,是否应该旨在保存地向你引荐你很或许喜爱的电影,即便这部电影不会让你脱离舒适区?

或许引荐服务是否应该扮演乖僻的音像店店员的人物,一边向你引荐你肯定喜爱的电影,一边冒险引荐一部你或许会以为无聊的电影?

网飞的电影引荐服务,是否应该旨在保存地向你引荐你很或许喜爱的电影,即便这部电影不会让你脱离舒适区?

或许引荐服务是否应该扮演乖僻的音像店店员的人物,一边向你引荐你肯定喜爱的电影,一边冒险引荐一部你或许会以为无聊的电影?

在其时的传统音像店中,新电影和盛行电影占了租借的大部分,传统音像店能够依托这些有限的挑选更容易地引荐电影。

网飞异乎寻常,其70%的租借都来自不相关的或陈旧的“压箱底” 电影。

面临如此巨大的电影数量,加上每次租借之间都有很长时刻的推迟,网飞依托自己的电影引荐体系Cinematch(电影匹配)来向用户引荐电影。

添加Cinematch对公司的赢利至关重要,由于他们有或许失掉那些极少看网飞电影或不喜爱等几天才干看到电影的用户,这些观众最有或许撤销订阅。

因而,网飞的工程师不断改善他们的Cinematch引荐算法。当他们再无力改善时,便决议举行网飞奖,奖赏榜首支引荐功率超越网飞算法10%的团队100 万美元奖金。

正如网飞首席执行官里德·黑斯廷斯(Reed Hastings)所指出的,对他们而言,付出巨额奖金并不算真实的危险,取得更好的电影引荐所带来的经济利益或许远远超越奖金的本钱。

即便他们的引荐体系只要细小的改善,也或许带来总体上的大成功,由于在网飞每天的数亿个引荐中,这一数字是成倍增长的。

假如一切参赛队都没到达10%的 方针,网飞也会颁布前进奖。假如参赛队每年都能取得足够大的前进,最好的部队将取得5 万美元的奖赏。

网飞只附加了一个条件:获胜者需求发布他们的引荐算法的细节。

网飞为参赛者供给了一个客观清晰的方针,然后简化了使命。参赛者需求猜测特定用户在特定日期为特定电影打出的星级评分。

网飞经过核算参赛者猜测的评分与用户在一个隐秘数据集(参赛者永久不会看到)上给出的实践评分之间的均匀方差来点评每个团队的体现。

每逢一个团队提交猜测成果,网飞就会在隐秘数据集上点评团队的体现,并在公共排行榜上更新他们的分数,其他团队和记者都会亲近重视他们的分数。

从技术上讲,一个团队依然能够经过提交很多的猜测来“窃视”这个数据会集的电影评分,但网飞十分聪明。

他们把另一个永久不会泄漏给参赛者的隐秘数据集藏了起来。这个两层保密的数据集只会在竞赛结束时用于点评最优异的提名人。

五、巨大的评分矩阵

鉴于网飞奖专心于用户的电影评分,所以把问题当作一个巨大的评分矩阵来考虑是有协助的。这个矩阵十分巨大:

它供给了17770部电影和480189个不同用户的评分。网飞供给了一些用户对某些电影的评分,并要求参赛者猜测一些缺失的评分(矩阵中的问号)。

尽管矩阵规划巨大,但只要1%的矩阵方格里有数字。不用说,大多数网飞用户都只给少量电影打过火。

那么参赛者应该从何下手呢?

在竞赛开端之初,大多数尖端竞赛者都选用十分类似的办法来剖析这些评分。

由AT&T和yahoo的研讨人员组成的“贝尔科” 队的成员指出,从简略的基准模型开端解说评分矩阵中最根本的趋势是很重要的。

“贝尔科”队的基准模型主要有两部分。榜首部分只适用于电影,咱们能够称之为“E.T.效应”。E.T.效应用来衡量一部电影的受欢迎程度,而不管是谁给它打分。

例如,在网飞的数据会集,最不受欢迎的电影是《吸血鬼猎人阿维亚》,这是一部低本钱的电影,叙述的是一个女性猎杀衣冠楚楚的吸血鬼的故事。

《吸血鬼猎人阿维亚》在网飞上有132个评分,均匀分只要1.5 星(满分5 星)。

亚马逊上有两条关于这部电影的谈论,其间一条谈论说——

我看了这部废物电影,应该得到酬劳的。这是在别人家后院用手持摄像机拍的。别看了。假如这能叫电影的话,那它便是我看过的最糟糕的电影!假如我事前知道的话,白送我也不看。

在另一个极点,最受欢迎的电影是奇幻片《指环王3:王者无敌》的加长版,在网飞的数据会集,这部电影有73000 个评分,均匀分为4.7 星,分数适当高。

它在亚马逊上得到了压倒性的好评,以下是亚马逊上对这部电影的一条谈论——

太棒了!假如你从未看过《指环王》三部曲,那么我强烈引荐!真是优异的三部曲。我特别喜爱加长版……

尽管这条谈论说的更多的是关于三部曲而不是单部电影,但明显观众喜爱它。

而在亚马逊上对这部电影的负面谈论,更多的是关于视频的格局或视频的卖家,而非对电影自身的。

原价:69.00现价:51.75

(笔记书堂立省21.2元)

1.你对网飞的做法有何点评?

2.你有什么处理企业功率的好办法

留言区一同评论吧,不少于35字

咱们将选出2位获赞数最多的,

赠送《智能机器怎么考虑:深度神经网络的隐秘》一本

截止时刻至2019年8月11日正午12:00

终究解说权,归笔记侠一切

石油大亨洛克菲勒:财富归于天主,我只不过是个管家

雷火电竞版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

历史,生态环境部:到达超低排放本年冬天重污染气候也无需停产!-雷火电竞网站

  • 国海证券,我国铝业(601600)融资融券信息(07-25)-雷火电竞网站

    国海证券,我国铝业(601600)融资融券信息(07-25)-雷火电竞网站

  • 小加一笔是什么字,陕鼓动力(601369)融资融券信息(07-25)-雷火电竞网站

    小加一笔是什么字,陕鼓动力(601369)融资融券信息(07-25)-雷火电竞网站

  • 奥特曼兄弟联手2无敌版,兴业证券(601377)融资融券信息(07-25)-雷火电竞网站

    奥特曼兄弟联手2无敌版,兴业证券(601377)融资融券信息(07-25)-雷火电竞网站

  • 最近发表

      雷火电竞网站_雷火电竞平台_雷火电竞

      http://www.vedicchef.com/

      |

      Powered By

      使用手机软件扫描微信二维码

      关注我们可获取更多热点资讯

      雷火电竞出品