导航:首页 > 电影资讯 > 电影推荐算法中如何预测

电影推荐算法中如何预测

发布时间:2022-04-25 22:54:25

㈠ 很多电影在上映之前就大喊着票房预测是多少多少,难道都是信口胡说出来的吗他们有没有什么计算方法

胡说肯定算不上,但也不见得都准确。既然是预测就有对有错。他那么一说你也就那么一听,如果自己说的再不信誓旦旦点儿别人哪能信呢?

一般来说根据影片的投资、剧本的质量、导演的名气、主角的号召力、特效团队的实力可以大概估计出一个票房数量,当然上映档期也要算好,如果遇到其他大片的围攻就坏了。

比方说《金陵十三钗》投资6亿,如果喊预计票房5亿那不是自己打自己耳光吗,所以就算明知不行该喊的话也得喊出去,反正又不需要负责。

㈡ 学IT的,写了一个电影推荐系统,但是为什么评分预测值大于五

全文以“预测电影评分”例子展开

r(i,j)=0则表明user_j没有对movie_i 没有评分,

推荐系统要做的就是通过预测user_j对这些movie {i|r(i,j)=0}的评分来给user_j 推荐其可能会喜欢的电影<预测评分较高的movie>

=======================================二、基于内容的推荐=======================================

对每个movie_i引入特征x(i)=(x1, x2),这种特征可能表明user对movie类型的偏好:浪漫or动作等

对于每个user引入一个参数theta,然后对评分矩阵的每列(对应一个user)做线性回归,数据是{ (x(i), y(i,j)) |r(i,j)=1,for some j all i}

像机器学习一样,x(i)添加个1变量x(i)=(1, x1, x2)

那么对于未评分的movie_t,我们可以使用线性回归训练的参数theta与对应特征x(t)做内积来得到其预测评分

对每个用户都训练一个参数theta_j,优化模型如下:

优化算法:注意正则项是不约束x(i)=(1, x1, x2)中1对应的参数theta的第一项theta0,所以k=0与k=1,2分别对待

=======================================三、协同过滤=======================================

现在换个角度:如果知道theta for all user j,如何来预测x(i) = (x1, x2) all i

仍然可以使用线性回归,为训练每个x(i),需要评分矩阵的第i行数据{ (x(i), y(i,j)) |r(i,j)=1,for some i all j}

theta_j = (0, theta1, theta2) ;theta1=5说明user_j喜欢romance类movie, theta2=5说明user_j喜欢action类movie,只能有一个等于5哦,

我觉得也可以是:theta_j = (0, 4, 1) ;喜欢romance 4 action 1.

对应的优化:

协同过滤:交替优化theta与x

=========================================四、协同过滤算法=======================================

优化:

优化:注意去掉了theta和x的添加项

=========================================五、实现细节补充=======================================

实现细节:

如果有user没有对任何电影评分或者所有评分的电影都是0分,那么所学习到的参数是零向量,

则预测都是0值,这是不合理的。通过 将评分矩阵减去其行均值再进行线性回归来“避免”这种情况

=========================================六、一点思考==========================================

协同过滤那块,同时优化theta、x,这样得到的theta、x还有特定的意义<比如:x是否还表征对影视类型的喜爱与否>没有?

回归中,在x数据上不添加1-feature是不是因为后来引入的平均值化;如果不是,那会对结果有什么影响?

用x-feature来表征一个movie,x-feature的各分量的可解释性;应该会有一部分user应为演员的缘故有一些"偏爱"。

这里,讲的"基于内容的推荐"与"协同过滤"跟以前对这两个词的认识/所指内容不同,查清楚、搞明白。

这周还会再更一篇关于此节课的算法实现,会对上述部分问题做出回答。

㈢ 已知某网站用户对电影评分数据(满分5分)。应用KNN算法预测哪位用户适合给小张推荐电影

已知某网站用户对电影评分数据(满分5分)。应用KNN算法预测哪位用户适合给小张推荐电影?
不要把手机关机

㈣ 阅读、电影和音乐的推荐算法,哪一个更难做

“阅读、电影和音乐的推荐算法,哪一个更难做?为什么?”关于这一问题,小编从诸多网友的回复中为你筛选了最用心、最高赞的回答!快来看看吧~

来看看网名为“幸运的ZLT0502”的网友是怎么说的:

电影---音乐----阅读!从我的经验来看,阅读是最难做到的,其次是音乐,最简单的就是电影。当然,是在有很多数据的前提下。从几个领域的特点来看:1.电影的item数量相对较少,好的电影有很长的生命周期,加上电影社区的用户行为,视频网站或预订网站,都很好获得,所以特别适合合作过滤。即使这不是一部大热门电影,你也可以根据导演、类型、明星等制作内容。这些都是结构化的信息,所以没有难度。音乐的item比电影要多一些,生命周期也非常不同,但它也可以用于基于用户行为的协同过滤。该算法如何表达和更新用户的兴趣?如何根据兴趣标签计算推荐结果?至少我没有看到特别成功的推荐阅读应用程序。算法上,都各有难度,但阅读类的,由于分类太多,在算法上自然要更加复杂。

来看看网名为“派网友”的网友是怎么说的:

个人认为无论是基于用户行为(协同过滤),还是基于内容相似度的推荐算法,难度从高到底都依次是:音乐-阅读-电影。

对于ID为“楼船吹笛雨潇潇”网友的精彩回答,大家纷纷点赞支持,他是这么说的:

我觉得是各有所难,并不能说哪个难,哪个容易。推荐的成功率:公共决策对推荐的影响:判断价值的建议:三者各有难度,但是个人在长期的习惯中可以对其中一种或者多种情景中加以选择和实践,但这也不是一蹴而就的事情,慢慢来吧。

你赞同哪位网友的观点呢?

㈤ 电影票房预测系统的电影票房如何预测

早在80年代,美国票房收入预测的先驱BarryLitman对美国80年代近700部电影进行分析推出票房收入预测模型。该系统对之后美国电影投资界产生了颠覆性的影响。电影票房预测系统能分析预测不同种类电影的票房价值,已经成为国际电影产业投融资的重要参考工具,对电影产品定价及衍生产品开发都具有较强的指导作用。

㈥ 推荐算法有哪些

推荐算法大致可以分为三类:基于内容的推荐算法、协同过滤推荐算法和基于知识的推荐算法。 基于内容的推荐算法,原理是用户喜欢和自己关注过的Item在内容上类似的Item,比如你看了哈利波特I,基于内容的推荐算法发现哈利波特II-VI,与你以前观看的在内容上面(共有很多关键词)有很大关联性,就把后者推荐给你,这种方法可以避免Item的冷启动问题(冷启动:如果一个Item从没有被关注过,其他推荐算法则很少会去推荐,但是基于内容的推荐算法可以分析Item之间的关系,实现推荐),弊端在于推荐的Item可能会重复,典型的就是新闻推荐,如果你看了一则关于MH370的新闻,很可能推荐的新闻和你浏览过的,内容一致;另外一个弊端则是对于一些多媒体的推荐(比如音乐、电影、图片等)由于很难提内容特征,则很难进行推荐,一种解决方式则是人工给这些Item打标签。 协同过滤算法,原理是用户喜欢那些具有相似兴趣的用户喜欢过的商品,比如你的朋友喜欢电影哈利波特I,那么就会推荐给你,这是最简单的基于用户的协同过滤算法(user-based collaboratIve filtering),还有一种是基于Item的协同过滤算法(item-based collaborative filtering),这两种方法都是将用户的所有数据读入到内存中进行运算的,因此成为Memory-based Collaborative Filtering,另一种则是Model-based collaborative filtering,包括Aspect Model,pLSA,LDA,聚类,SVD,Matrix Factorization等,这种方法训练过程比较长,但是训练完成后,推荐过程比较快。 最后一种方法是基于知识的推荐算法,也有人将这种方法归为基于内容的推荐,这种方法比较典型的是构建领域本体,或者是建立一定的规则,进行推荐。 混合推荐算法,则会融合以上方法,以加权或者串联、并联等方式尽心融合。 当然,推荐系统还包括很多方法,其实机器学习或者数据挖掘里面的方法,很多都可以应用在推荐系统中,比如说LR、GBDT、RF(这三种方法在一些电商推荐里面经常用到),社交网络里面的图结构等,都可以说是推荐方法。

㈦ 奈飞公司的创新的大数据推荐算法

第一个Netflix大奖成功的解决了一个巨大的挑战,为提供了50个以上评级的观众准确的预测他们的口味。下一个百万大奖目标是,为那些不经常做影片评级或者根本不做评级的顾客推荐影片,要求使用一些隐藏着观众口味的地理数据和行为数据来进行预测。同样,获胜者需要公开他们的算法。如果能解决这个问题,Netflix就能够很快开始向新客户推荐影片,而不需要等待客户提供大量的评级数据后才能做出推荐。
新的比赛用数据集有1亿条数据,包括评级数据,顾客年龄,性别,居住地区邮编,和以前观看过的影片。所有的数据都是匿名的,没有办法关联到netflix的任何一个顾客。
与第一个大奖赛不同,这次比赛没有设定比赛目标。50万美金首先奖励给6个月内取得领先的团队,另外50万美金奖励给18个月后取得领先的团队。
推荐引擎是Netflix公司的一个关键服务,1千多万顾客都能在一个个性化网页上对影片做出1-5的评级。Netflix将这些评级放在一个巨大的数据集里,该数据集容量超过了30亿条。Netflix使用推荐算法和软件来标识具有相似品味的观众对影片可能做出的评级。两年来,Netflix 已经使用参赛选手的方法提高了影片推荐的效率,这已经得到了很多影片评论家和用户的好评。
Strands推荐引擎的首席科学家里克·汉加特纳博士写道:“在短期内,搜索引擎将会越来越多地加入简单的推荐技术,以处理接近的查询词(例如,“您要找的是这个,根据类似查询/其他人的搜索,你可能要寻找的是这个。”)但从长期来说,而比起搜索行业和搜索技术,推荐技术会更加地无孔不入。”

㈧ 电影票房预测系统的BRP(电影票房量化分析系统)的三大特点

BRP系统每周总票房的范围预测法通过自适应分类,可根据电影知识库中各周电影票房分布进行票房等级分类,使每周预测的票房范围更为精确,缩小预测范围。同时,其最终估值范围通过波动性提示并衡量了相关风险的存在。这对于投资制片方进行有针对性的风险度量、风险管理及防范都具有重要意义。由于电影产业影响票房业绩的变量众多,蕴含复杂的系统及非系统风险,BRP系统能将之定量化并确定总体风险收益规模,无论对于即期电影发行,还是后续衍生开发,都具有重要的指导性。

㈨ 怎样预测票房


票房预测:需求与现实



从1896年西洋影戏传入上海徐园,到1905年中国拍摄首部国产电影《定军山》,再到2013年全国电影票房突破200亿
大关,(4)有着百余年历史的中国电影产业,在近几年呈现出飞跃式发展的态势,无论是影片质量、院线建设还是投资规模都有了长足的发展。与此同时,随着
“大数据”时代的到来,电影观影群体、观影偏好与心理、电影信息传播和获取方式也都在发生着深刻的变化。



毋庸置疑,多样化资本的加入是中国电影不可或缺的发展引擎,然而,电影行业以投资回报率难以预测著称,大投入未必有大产出,票房预测工具的缺失使得投资者
无法有效对冲投资风险,华人著名导演吴宇森的《风语者》就拖累了米高梅公司最终走向破产。因此制作与发行公司不得不考虑所有对票房有影响的因素:辣妈李小
璐对《私人订制》票房贡献几何;《风暴》票房为何远低于其金牌制片人江志强预期;被吐槽“烂片”的《富山春居图》和《小时代》缘何票房却一路走红;成龙大
叔的《警察故事2013》有无必要拍成3D;《泰囧》的“报复性”观影效应能否复现……这一切的一切其实都可以从“大数据”中找到答案。因为网络上的每一
次浏览、查询乃至点击所汇聚成的群体智慧都“蝴蝶效应”般地影响着电影的最终票房。



2013年Google在一份名为《Quantifying Movie Magic with Google Search》(5)
的白皮书中公布了其电影票房预测模型,该模型主要利用搜索、广告点击数据以及院线排片来预测票房,Google宣布其模型预测票房与真实票房的吻合程度达
到了94%,但并未见其公开对未上映电影的预测结果。



搜狗公司借助“深思”系统,建立了更为复杂的模型,用于预测国内电影票房,并在新浪微博上提前发布了2013年12月国内上映电影的首周票房预测结果。很高兴到目前为止预测结果与真实数据非常接近,同时,我们的模型还可以用于对影响票房的因素进行定量分析。





搜索查询量的奥秘



搜狗搜索每天都响应上亿次的搜索请求,查询词的分布和变化趋势能够很好的反映出中国网民的兴趣点和关注指向。与Google的研究类似,我们也发现,电影
上映前相关查询词的搜索次数与票房收入有着很强的关联性。这一点很好理解,用户的主动搜索行为体现了用户对这部电影的潜在兴趣。



我们选取了2013年1-11月国内上映的180部电影的票房和上映前的搜索量数据作为训练集,用于训练一个基础的线性回归模型。实验发现,单纯利用搜索
量训练得到的模型,预测得到的首周票房与真实票房的相关度R方值仅为68%,这与Google仅用搜索数据得到的结果70%很接近。(注:R方值取值为0
至1,值越大表示模型预测效果越好),这个结果也说明无论在中国还是美国,用户的搜索行为是很相似的。





用搜索量来进行预测票房是一个好的开始,但是准确度还远远不够。同时很多搜索词还存在歧义的情况,比如《生化危机》,既是电影也是游戏,混在一起会造成票
房预测值偏高。进一步研究发现,游戏意图的查询请求量较为平稳,但电影意图的查询请求在上映前则有一个高峰,也可以通过用户点击的URL来进一步确认用户
的搜索意图。因此模型需要再引入查询量的变化趋势和用户点击的分布情况。修正后的模型可以达到74%的准确度,这时模型已经可以对电影票房进行一个粗略的
估计。







社交媒体:用户的情感分析



社交媒体数据对票房预测也会有一定帮助。假设你是某个明星的粉丝,打算去看他主演的电影,那么你很可能会提前转发该电影的相关微博给你的朋友。国外已经有
很多预测项目都是在针对Twitter数据做研究,这里我们主要采用国内部分微博网站的数据来进行预测。通过自然语言理解技术,分析出用户对未上映影片的
情感倾向,从而转换为用户的观影需求。进一步可以考虑的因素包括微博转发深度、评论活跃程度,以及相关微博数量随电影上映日期临近的变化趋势,这些数据都
可以被有效的提炼为特征并加入到模型中。



微博数据的加入使得准确率超过了80%。





结语



预测专家纳特·西尔弗在《信号与噪声:大数据时代预测的科学与艺术》一书中提到,大数据时代的预测更容易失败,大部分失败的预测都源于一种盲目的自信,用精确的预测来冒充准确的预测。



对此我们有着清醒的认识,目前的票房预测模型还有若干需要改进的方向。首先,目前模型的主要思想是通过电影上映前的用户关注度来推算首周票房,这实际上没
有考虑电影上映后的口碑对票房的影响;其次,模型较为依赖历史数据,可能难以识别一些上映后脱颖而出的小成本“黑马”电影;再次,目前的技术只能提前10
天预报出首周票房,还可以更加超前。



总体而言,“深思”系统代表了搜狗公司在社会化预测方面一些新的尝试。我们试着从繁杂的海量数据中筛选出真正的信号,努力穿越不确定性的迷雾,区分出未来
图景的哪些部分可以预测,哪些不可预测。通向这个未来的道路还在探索之中,但目前工作已经取得了一些不错的进展,并给予了我们更大的信心。

阅读全文

与电影推荐算法中如何预测相关的资料

热点内容
奇迹男孩免费电影下载 浏览:672
近期好看的电影恐怖电影 浏览:339
哪些二战电影看完二战 浏览:225
周润发朱茵的电影有哪些 浏览:995
东瀛霸刀这部电影叫什么 浏览:267
昆仑神宫电影完整免费西瓜 浏览:390
推荐几部好看的保镖题材电影 浏览:772
十分钟电影剧本怎么写 浏览:850
艾伦拍过哪些电影 浏览:718
苹果手机怎么无线传电影 浏览:6
耗资大的好看电影 浏览:478
巩俐以前演过的电影有哪些 浏览:513
优酷电影欧美大片免费看 浏览:389
下载电影大概多少流量 浏览:906
哪些电影女主角 浏览:102
韩国好看精彩电影 浏览:826
横店电影城王府井店怎么进去 浏览:681
总裁在上3电影免费 浏览:391
高清电影怎么传到ipad上 浏览:237
如何看恐怖电影不害怕 浏览:859