将巨大的数据转化为生产力并非易事
着名导演大卫芬奇曾拿着《纸牌屋》的改编剧本,找过美国多家电视台,却没有一家敢掏钱,因为谁也说不准一部20年前的老剧是否还有市场。Netflix也有类似的担心,于是进行了电视剧消费习惯数据库分析。最终,Netflix发现老剧《纸牌屋》依旧是点播热门,而点播该剧的用户群,也几乎和站上大卫芬奇、凯文史派西的粉丝圈重合,于是决定投资1亿美元重拍,并由大卫芬奇导演、凯文史派西主演该剧。
相比传统收视率统计只抽取数千个样本户,算出《纸牌屋》的数据库却包含了3000万用户的收视选择、400万条评论、300万次主题搜索,是名副其实的大数据。这些数据源自Netflix数年来积累的数据资源。当一位用户通过浏览器登录Netflix账号,Netflix后台技术将用户位置数据、设备数据悄悄地记录下来。
这些记忆代码还包括用户收看过程中所做的收藏、推荐到社交络等动作只需要一键就可以搞定。。在Netflix看来,暂停、回放、快进、停止等动作都是一个行为,每天用户在Netflix上将产生高达3000多万个行为。此外Netflix的订阅用户每天还会给出400万个评分,300万次搜索请求,询问剧集播放时间和设备。这些都被Netflix转化成代码,当作内容生产的元素记录下来。
为了找到分析大数据的方法,Netflix没有少花功夫。首先,千万级别的用户对站提供的影片给出1至5星的评级,几年下来相关数据的总量超过百亿条。要找准用户推荐新影视剧,识别观众品位需要一个算法。
然而要将巨大的数据转化为生产力并非易事。长年以来,为了提高算法精准,Netflix一直举办大型比赛招贤纳士但如果是几家的东西都在卖来,以此拓宽数据挖掘处理能力。2005年底,Netflix曾开放一数据集,并设立百万美元的奖金(netflix prize),征集能够使其推荐系统性能上升10%的推荐算法和架构。这个数据集包含了超过48万个匿名用户对大约近2万部电影做的大约10亿次评分。
兰州白癜风医院哪家好怀化治疗白斑的医院乌兰察布白癜风治疗费用-
“帮信”就是“帮凶”!两名帮助核心技术犯罪嫌疑人落网东阿
大众网·海报新闻记者 廖伟 聊城华盛顿邮报7年底3日,东阿县公安部门刑侦三...
2024-12-30
-
的国际生物多样性日|生命因多样而精彩
星球不仅是全人类的原居 也是冰冻所有生物的合作原居 生物自然的减损 不太...
2024-12-30
-
“钻”进市民孤独,我们和成都首家社区画廊主理人聊了聊
寅识 Gallery 紧邻在武侯区中城东路郊外,这片街区也被人习惯性的称为黑正门...
2024-12-29
-
两句话就能测试出老板到底提拔你,如果老板这样回复,你就死心吧
很多人在职守门员摸爬滚打了好多年,却无论如何得不到经纪人的起用,有的...
2024-12-23
-
2022年中国国际服务边境贸易交易会 北美线上推介会成功举办
5同年20日,2022年中国国际间增值商路参展澳大利亚线上推介会成功举办。此...
2024-12-21
-
陈戌源这次动真格!新身份包揽中国足球复国任务,高洪波当他助手
我们知道,身为立国际背协主席的陈戌源,现任立国家所队杯赛督战以及后勤...
2024-12-14