导航:首页 > 电影资讯 > 电影数据如何分析

电影数据如何分析

发布时间:2023-03-01 09:10:35

Ⅰ 从电影网站爬取数据并进行可视化分析会用到哪些数据

从电影网站爬取数据并进行可视化分析会用到的数据如下。
1、beautifulsoup、re、urllib库。
2、SQLite包,数据可视化方面主要用到flask框架、echarts和wordcloud等。
3、此类数据可以搭建简单的数据可视化网站。

Ⅱ 豆瓣电影数据分析报告

        近年来电影产业迅猛发展,其已成为重要的艺术和娱乐。同时,电影也是说明一个国家的经济水平。因此分析电影书有助于电影工业的发展趋势。

1、 每年的电影的数量,以及每年的电影平均评分

2、 电影那种类型最多,以及前三名的百分比

3、 各个国家的电影数量最多

4、 中国跟美国各个年代对比

1、 每年的电影的数量,以及每年的电影分均分

        由图可见,从 2000 年开始电影年产量的趋势不断上升,而近年些年的评分越来越

低,从评分均值上看一直属于下滑状态。可以推测出,电影的数量会有大幅的上升,

而电影的质量整体下滑。

2、 电影那种类型最多,以及前三名的百分比

        从词云图的电影类型可见,剧情、动作、喜剧的电影类型出现的频率很高。而从环形图

中可以看出动作、喜剧、剧情这三个电影类型对比,历年来剧情的电影类型是最多的,其

次是喜剧,由此可以了解观众的喜好。

3、电影数量在前五名国家的评分情况?

从树状图可以看出美国的电影数量最多,其次是中国、日本、英国、法国。

4、中国跟美国各个年代对比?

        从图中可以看出中国的电影发展趋势一直处以上升阶段,而美国的发展趋势不太乐

观。以目前中国的发展趋势很快就会追上美国,目前美国还是领先阶段。

Ⅲ 票房预测数据来源

中国电影票房数据分析
2016年中国电影票房分析
据不完全统计,截止到12月29日下午6时,2016年内地电影票房已达450.76亿,已超过去年票房总成绩440亿。其实,从2003年至2015年中国电影一直保持平均35%的市场增长率,2015年我国电影票房市场已经达到441亿,过去6年复合增速38.6%。但根据目前的整体票房走势来看,2016年的票房增速约3%,这也是17年来,我国电影票房增长最慢的一年。票房增长率13年来首次低于25%截至12月23日,2016年内地电影票房突破441亿,用时358天才艰难超过了去年440.69亿元的全年总票房,与2015年仅用时9个多月就超过2014年电影票房的速率相差甚远,今年全年票房增长率13年来将首次低于25%。数据来源:中商产业研究院整理从均观影次数来看,近年来我国平均观影人次逐年攀升,2015年中国人均观影次数已经达到1.6次;预计2016年中国电影观影人次将达1.7人次,但距发达国家人均3-4次的观影次数仍有较大差距。数据来源:中商产业研究院整理仅九部电影票房超10亿另外,2016年《美人鱼》、《疯狂动物城》和《魔兽》分别以33.9亿、15.3亿、14.7亿元的成绩成为今年内地电影票房冠、亚、季军。《美国队长3:英雄内战》、《西游记之孙悟空三打白骨精》、《湄公河行动》、《澳门风云3》、《盗墓笔记》和《功夫熊猫》刘部国产片跻身10亿元俱乐部,领衔今年华语片票房排行榜。截至目前,今年共有84部在内地公映的中外电影票房过亿,其中华语片共有41部过亿。不过《摆渡人》、《铁道飞虎》12月23日刚刚首映,无论口碑如何,相信两部电影票房过亿都毫无悬念。2016年度国内电影票房前十排行榜数据来源:艺恩 中商产业研究院整理(截止2016年12月30日)未来预期目前,中国电影进入繁荣发展的黄金机遇期。中国电影产量位居全球第三,今年中国电影产量不减,预计年底将突破700部。今年电影市场增长速度减缓,但依然在增长。预计,2016年电影市场或将达到454亿,增速3%,增长速度略缓。
另外,相关数据显示,今年有84部影片过亿,相比去年的81部有所提高。观影人数约在13亿,比去年12亿也有所增长。而12月下旬,国家新闻出版广电总局发布最新数据,中国电影银幕已超过4万块,跃居世界第一。2016年,中国电影银幕以每天增加26块的速度递增,超过了2015年每天增加22块的速度。值得关注的是:近期,阿里巴巴影业联合上戏、复星探索影视人才培养新模式。苹果收购已破产流媒体音乐公司,吸收技术和人才;Instagram也将推出直播功能。这些都反映我国影视传媒行业市场前景可期。中商产业研究院简介中商产业研究院是深圳中商情大数据股份有限公司下辖的研究机构,研究范围涵盖智能装备制造、新能源、新材料、新金融、新消费、大健康、“互联网+”等新兴领域。公司致力于为国内外企业、上市公司、投融资机构、会计师事务所、律师事务所等提供各类数据服务、研究报告及高价值的咨询服务。中商行业研究服务内容行业研究是中商开展一切咨询业务的基石,我们通过对特定行业长期跟踪监测,分析行业需求、供给、经营特性、盈利能力、产业链和商业模式等多方面的内容,整合行业、市场、企业、用户等多层面数据和信息资源,为客户提供深度的行业市场研究报告,全面客观的剖析当前行业发展的总体市场容量、竞争格局、进出口情况和市场需求特征等,对行业重点企业进行产销运营分析,并根据各行业的发展轨迹及实践经验,对各产业未来的发展趋势做出准确分析与预测。中商行业研究报告是企业了解各行业当前最新发展动向、把握市场机会、做出正确投资和明确企业发展方向不可多得的精品资料。中商行业研究方法中商拥有10多年的行业研究经验,利用中商Askci数据库立了多种数据分析模型,在产业研究咨询领域利用行业生命周期理论、SCP分析模型、PEST分析模型、波特五力竞争分析模型、SWOT分析模型、波士顿矩阵、国际竞争力钻石模型等、形成了自身独特的研究方法和产业评估体系。在市场预测分析方面,模型涵盖对新产品需求预测、快速消费品销售预测、市场份额预测等多种指标,实现针对性的进行市场预测分析。
中商研究报告数据及资料来源中商利用多种一手及二手资料来源核实所收集的数据或资料。一手资料来源于中商对行业内重点企业访谈获取的一手信息数据;中商通过行业访谈、电话访问等调研获取一手数据时,调研人员会将多名受访者的资料及意见、多种来源的数据或资料进行比对核查,公司内部也会预先探讨该数据源的合法性,以确保数据的可靠性及合法合规。二手资料主要包括国家统计局、国家发改委、商务部、工信部、农业部、中国海关、金融机构、行业协会、社会组织等发布的各类数据、年度报告、行业年鉴等资料信息。
数据来源 数据种类
金融机构 金融机构公开发布的各类年度数据、季度数据、月度数据等
政府部门 宏观经济数据、行业经济数据、产量数据、进出口贸易数据等
行业协会 年度报告数据、公报数据、行业运行数据、会员企业数据等
社会组织 国际性组织、社会团体公布的各类数据等
行业年鉴 农业、林业、医疗、卫生、教育、环境、装备、房产、建筑等各类行业数据
公司公告 资本市场各类公司发布的定期年报、半年报、公司公告等
期刊杂志 在开期刊杂志中获取的仅限于允许公开引用、转载的部分
中商调研 研究人员、调研人员通过实地调查、行业访谈、获取的一手数据
中商的产业研究服务优势
产业研究优势 优势体现
丰富的数据资源、强大数据挖掘能力 中商是中国首家自建数据库系统的产业研究咨询机构,公司自主研发的Askci数据库和CISource中商情报通对各类数据建立中商企业数据库、全球数据库、宏观经济数据库、行业数据库、区域数据库、调研数据库等专业数据库,覆盖近5000多个细分产业数据。
知名的研究团队,优质的研究咨询服务 中商拥有具备专业背景知识和熟悉产业运营的复合型人才, 产业分析师、行业专家及咨询顾问共计300余名,在宏观经济、区域经济、细分行业及政策法规研究方面具备很强的实力。公司研究团队为客户提供专业的产业研究咨询服务及个性化的专项咨询服务。
专门的客服团队,满足客户个性化咨询服务 公司建立了专门的客服团队,能够更为准确的了解客户的需求并满足,并且能够对客户的需求进行快速的处理,深入为客户提供多样化、个性化产品解决方案。通过加强员工培训与业务创新,开创了民营银行筹建、保险公司筹建等新型咨询服务业务。
产业大数据平台成就最具影响力行业门户 公司旗下中商情报网是是国内专业的商业大数据发布和查询平台,经过多年的发展吸引培养了一批忠实用户,已成为中国财经领域“最具影响力行业门户”,为国内外企业、金融从业人员、创业人员、科研院所工作者等提供客观、时效、高价值的商业资讯。
中商的影响力国家政府部门及权威媒体广泛报道与引用中商产业研究院专业研究结论国内外主流财经媒体及国家政府部门大量引用中商数据及研究结论,如央视财经、凤凰财经新浪财经、中国经济信息网、国家商务部、发改委、国务院发展研究中心(国研网)等。

5
网络文库VIP限时优惠现在开通,立享6亿+VIP内容
立即获取
中国电影票房数据分析
2016年中国电影票房分析
第 1 页
据不完全统计,截止到12月29日下午6时,2016年内地电影票房已达450.76亿,已超过去年票房总成绩440亿。其实,从2003年至2015年中国电影一直保持平均35%的市场增长率,2015年我国电影票房市场已经达到441亿,过去6年复合增速38.6%。但根据目前的整体票房走势来看,2016年的票房增速约3%,这也是17年来,我国电影票房增长最慢的一年。
票房增长率13年来首次低于25%
截至12月23日,2016年内地电影票房突破441亿,用时358天才艰难超过了去年440.69亿元的全年总票房,与2015年仅用时9个多月就超过2014年电影票房的速率相差甚远,今年全年票房增长率13年来将首次低于25%。
第 2 页
数据来源:中商产业研究院整理
从均观影次数来看,近年来我国平均观影人次逐年攀升,2015年中国人均观影次数已经达到1.6次;预计2016年中国电影观影人次将达1.7人次,但距发达国家人均3-4次的观影次数仍有较大差距。
第 3 页
数据来源:中商产业研究院整理
仅九部电影票房超10亿
另外,2016年《美人鱼》、《疯狂动物城》和《魔兽》分别以33.9亿、15.3亿、14.7亿元的成绩成为今年内地电影票房冠、亚、季军。《美国队长3:英雄内战》、《西游记之孙悟空三打白骨精》、《湄公河行动》、《澳门风云3》、《盗墓笔记》和《功夫熊猫》刘部国产片跻身10亿元俱乐部,领衔今年华语片票房排行榜。
截至目前,今年共有84部在内地公映的中外电影票房过亿,其中华语片共有41部过亿。不过《摆渡人》、《铁道飞虎》12月23日刚刚首映,无论口碑如何,相信两部电影票房过亿都毫无悬念。

Ⅳ Python分析44130条用户观影数据,挖掘用户与电影之间的隐藏信息!

很多电影也上映,看电影前很多人都喜欢去 『豆瓣』 看影评,所以我爬取44130条 『豆瓣』 的用户观影数据,分析 用户之间 的关系, 电影之间 的联系,以及 用户和电影之间 的隐藏关系。

在****『豆瓣』****平台爬取用户观影数据。

为了获取用户,我选择了其中一部电影的影评,这样可以根据评论的用户去获取其用户名称(**后面爬取用户观影记录只需要****『用户名称』******)。

url中start参数是页数(page 20,每一页20条数据),因此start=0、20、40...,也就是 20的倍数 ,通过改变start参数值就可以获取这 4614条用户的名称。 *

查看网页的标签,可以找到******『用户名称』******值对应的标签属性。

上一步爬取到****『用户名称』****,接着爬取用户观影记录需要用到****『用户名称』。****

[图片上传失败...(image-65a80e-1624889400616)]

通过改变****『用户名称』****,可以获取到不同用户的观影记录。

url中start参数是页数(page 15,每一页15条数据),因此start=0、15、30...,也就是 15的倍数 ,通过改变start参数值就可以获取这 1768条观影记录称。 *

查看网页的标签,可以找到****『电影名』****值对应的标签属性。

excel表有两个标题(用户, 影评)

定义了写入excel函数,这样爬起每一页数据时候调用写入函数将数据保存到excel中。

最后采集了44130条数据(原本是4614个用户,每个用户大约有500~1000条数据,预计 400万条数据 )。但是为了演示分析过程,只爬取每一个用户的前30条观影记录( 因为前30条是最新的 )。

最后这44130条数据会在 下面分享给大家

从豆瓣.xls中读取全部数据放到datalist集合中。

以用户 『mumudancing』 为例进行用户画像

以用户 『mumudancing』 为例,对用户之间进行 电影推荐

以电影 『送你一朵小红花』 为例,对电影之间进行 电影推荐

Ⅳ 豆瓣电影数据分析的背景与意义

豆瓣电影数据分析的背景与意义是电影发展的衡量标准。根据查询相关资料信息显示:豆瓣已经成为国内电影爱好者、影评人士的聚集地,豆瓣评分已经成为国内一个评价电影的重要指标,豆瓣上积攒了大量电影数据为电影行业分析提供了重要资源,通过豆瓣电影来衡量国内外的电影的发展情况。

Ⅵ 电影评分数据统计分析的作用和意义

通过观众对电影的评分的分析,可以在一定程度上给电影行业启发。数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。

Ⅶ 11月电影市场数据分析哪里

中商情报网讯:10月全国票房最终收官于36.44亿,同比下降29.3%,创下2016年9月之后,整整两年来的单月跌幅之最。在经过7月和8月暑期档单月大盘连续两个月逼近70亿大关后,后期电影票房明显下沉。目前已进入到2018年第四季度,但电影市场还是保持着一贯的冷漠。不过在国庆假期的加持下,10月票房相比9月30.99亿元来说,环比增长17.6%;单月观影人次为10531万人,环比增长19.82%;10月电影上映场次983.15万场,比9月上映场次增加了85.17万场。2018年1-10月全国市场共产出综合票房约525亿元。
2018年1-10月票房收入突破525亿
中国电影产业在国民经济新的发展形势下实现了稳健增长。以电影票房收入衡量,我国电影市场已经成为仅次于美国的全球第二大电影市场。统计数据显示,我国电影票房市场近年来保持高速增长的态势,观影人次从2007年的0.71亿,增长2016年的13.72亿,年均复合增长率达到34.47%。国内电影票房从2012年的170.7亿元增长到2017年559.1亿元,年均复合增长率达到26.78%。2018年1-10月全国电影票房累计达525.3亿元。按照今年电影票房趋势来看,2018年全国电影票房超越2017年的559.1亿元基本是毫无压力。
数据来源:中商产业研究院整理
10月电影市场凄惨收官 同比大降29.3%
根据猫眼专业版数据,2018年10月电影票房共计36.44亿元,较去年同期51.53亿元票房,同比下降29.3%。10月上映影片中,国庆档影片《无双》《影》等影片票房居前。
除4月票房有所下滑外,2018年单月票房都取得较好的成绩,其中2月101亿票房位居榜首,这无疑给2018年电影市场带来了一个良好的开端!2018年上半年电影市场大涨18%,进入到暑期档7月-8月,票房再次实现大涨,其中7月同比增长37.9%至69.5亿元,仅次于春节档2月票房,到8月票房同比略有下滑。9月票房下沉明显,环比大降54.6%。10月在国庆假期加持下票房环比增长17.6%。但却是2016年9月之后,整整两年来的单月同比跌幅之最。
数据来源:猫眼、艺恩、中商产业研究院整理
《无双》单月票房第一《影》排名第二
在2018年10月电影票房排行榜上,榜单前十部影片中有7部电影票房都在1亿元之上,3部影片超3亿大关。其中庄文强执导的犯罪题材港片《无双》以票房11.69亿霸占月度冠军之位。该片9月底上映累计票房顺利破10亿,累计分账票房成功超越《澳门风云3》(11.16亿),打破发哥演员生涯的内地票房纪录。截至11月1日14:30,该片连续24日获得单日票房冠军,累计综合票房达到12.26亿元,分账票房11.3亿元,猫眼评分高达8.9分,口碑与票房双丰收。
影片《影》单月票房第二,10月票房为5.59亿元,猫眼评分8.2分。作为张艺谋申奥影片,《影》自筹拍时期就成为相关媒体的聚焦点。尽管《影》在视觉上追求的以水墨风格形成的形式化美感再次以极致表现给观众留下深刻印象,但这部作品并未给观众带来更多的惊喜和震撼。月度排名第三的是开心麻花团队的喜剧片《李茶的姑妈》,10月累计票房4.95亿元,猫眼评分7.9分。《找到你》票房第四,10月累计票房2.67亿元。《胖子行动队》以2.28亿元票房排名第五,《铁血战士》10月票房拿下1.72亿元,排名第六。
数据来源:猫眼、中商产业研究院整理
前三电影票房占比超六成
10月全国电影票房分布集中在国庆档影片,排名前五部都是国庆档电影。其中《无双》单月占据总票房32.1%,《影》占比15.3%,《李茶的姑妈》占13.6%。排名前三位的电影票房占比合计占当月总票房的61.3%。
数据来源:猫眼、中商产业研究院整理
11月上映电影前瞻
从阵容来看,11月进口片是迪士尼与华纳兄弟在国内电影市场的一次交锋。迪士尼在月初与月末先后上映真人童话电影《胡桃夹子与四个国王》与经典动画续集电影《无敌破坏王2:大闹互联网》。华纳兄弟则发力下半场,在月中与月末先后上映《神奇动物:格林德沃之罪》与亚裔阵容的喜剧爱情电影《摘金奇缘》。另外《毒液》作为“蜘蛛侠宇宙”中的非典型英雄,该片北美市场目前累计票房达到1.87亿美元。值得一提的是,目前《毒液》联合火箭少女101推出的推广歌曲《毒液前来》成功引起公众注意,猫眼想看人数超过30万,11月进口片中人数最高。11月上映影片信息一起来看一下吧!
资料来源:猫眼、中商产业研究院整理
更多资料请参考中商产业研究院发布的《2018-2023年中国电影行业发展前景及投资机会分析报告》。

Ⅷ 豆瓣电影数据分析

这篇报告是我转行数据分析后的第一篇报告,当时学完了Python,SQL,BI以为再做几个项目就能找工作了,事实上……分析思维、业务,这两者远比工具重要的多。一个多月后回过头来看,这篇报告虽然写得有模有样,但和数据分析报告还是有挺大差别的,主要原因在于:a.只是针对豆瓣电影数据分析太过宽泛了,具体关键指标到底是哪些呢?;b.没有一个确切有效的分析模型/框架,会有种东一块西一块的拼接感。
即便有着这些缺点,我还是想把它挂上来,主要是因为:1.当做Pandas与爬虫(Selenium+Request)练手,总得留下些证明;2.以豆瓣电影进行分析确实很难找到一条业务逻辑线支撑,总体上还是描述统计为主;3.比起网上能搜到的其他豆瓣电影数据分析,它更为详细,可视化效果也不错;

本篇报告旨在针对豆瓣电影1990-2020的电影数据进行分析,首先通过编写Python网络爬虫爬取了51375条电影数据,采集对象包括:电影名称、年份、导演、演员、类型、出品国家、语言、时长、评分、评论数、不同评价占比、网址。经过去重、清洗,最后得到29033条有效电影数据。根据电影评分、时长、地区、类型进行分析,描述了评分与时长、类型的关系,并统计了各个地区电影数量与评分。之后,针对演员、导演对数据进行聚合,给出产量与评分最高的名单。在分析过程中,还发现电影数量今年逐步增加,但评分下降,主要原因是中国地区今年低质量影视作品的增加。

另外,本篇报告还爬取了电影票房网( http://58921.com/ )1995-2020年度国内上映的影片票房,共采集4071条数据,其中3484条有效。进一步,本文分析了国内院线电影票房年度变化趋势,票房与评分、评价人数、时长、地区的关系,票房与电影类型的关联,并给出了票房最高的导演、演员与电影排名。

清洗、去重后,可以看到29033条数据长度、评分、评论数具有以下特点:

结合图1(a)(b)看,可以看到电影数据时长主要集中在90-120分钟之间,向两极呈现阶梯状递减,将数据按照短(60-90分钟),中(90-120分钟),长(120-150分钟),特长(>150分钟)划分,各部分占比为21.06%, 64.15%, 11.95%, 2.85%。

结合图2(a)看,可以看到我们采集到的电影数据评分主要集中在6.0-8.0之间,向两极呈现阶梯状递减,在此按照评分划分区间:2.0-4.0为口碑极差,4.0-6.0为口碑较差,6.0-7.0为口碑尚可,7.0-8.0为口碑较好,8.0-10.0为口碑极佳。

这5种电影数据的占比分别为:5.78%, 23.09%, 30.56%, 29.22%, 11.34%

再将评分数据细化到每年进行观察,可以发现,30年内电影数量与年度电影均分呈反相关,年度均分整体呈现下降趋势,2016年电影均分最低,电影数量最多。

进一步做出每个年份下不同评级等级的电影数据占比,可以发现,近年来,评分在[2.0,6.0)的电影数据占比有着明显提升,评分在[6.0,7.0)的数据占比不变,评分在[7.0,10.0)的数据占比减少,可能原因有:

对照图5,可以发现,评分与时长、评论人数的分布大致呈现漏斗状,高分电影位于漏斗上部,低分电影位于漏斗下部。这意味着,如果一部电影的评论人数很多(特别是超过30w人观影),时长较长(大于120min),那么它大概率是一部好电影。

根据各个国家的电影数量作图,可以得到图6,列出电影数量前十的国家可得表格2,发现美国在电影数量上占第一,达到8490部,中国其次,达6222部。此外,法国,英国,日本的电影数量也超过1000,其余各国电影数量相对较少。这可以说明美国电影有着较大的流量输入,在中国产生了较大的影响。

进一步分析各国电影的质量,依据评分绘制评分箱线图可得图7,在电影数量排名前20的国家中:

接着我们可以探索,哪个国家的电影对豆瓣评分随年份下降的贡献最大,考虑到电影数量对应着评分的权重。根据上述各国的电影评分表现,我们可以猜测电影数量较多的国家可能对年度均分的下降有较大影响。于是,我们再计算出这些国家的年度电影均分,并与整体均分进行比较分析。

再作出中国大陆,中国台湾,中国香港的均分箱线图图9(a),可以看到,大陆电影均分低于港台电影,且存在大量低分电影拉低了箱体的位置。

分析相关性可得,大陆、香港、台湾电影年度均分与全部评分关联度分别为R=0.979,0.919,0.822,说明滤去台湾和香港电影,大陆电影年度均分的变化趋势与全部评分变化更接近。图9(b)可以进一步反映这一点。

可以看到,大部分类型集中在X×Y=[10000,30000]×[6.00,7.50]的区间范围内,剧情、喜剧、爱情、犯罪、动作类电影数量上较多,说明这些题材的电影是近三十年比较热门的题材,其中剧情类电影占比最多,音乐、传记类电影平均得分更高,但在数量上较少,动作、惊悚类电影评论人数虽多,但评价普遍偏低。

除此之外,还有两块区域值得关注:

根据类型对电影数据进行聚合,整理得到各类型电影评分的时间序列,计算它们与整体均分时间序列的相关性,可得表格4与图11,可以看到剧情,喜剧,悬疑这三种类型片与总分趋势变化相关性最强,同时剧情、喜剧类电影在电影数量上也最多,因此可以认为这两类电影对于下跌趋势影响最大,但其余类别电影的相关性也达到了0.9以上,说明几种热门的电影得分的变化趋势与总体均分趋势一致。

前面已经得知,中美两国电影占比最高,且对于均分时间序列的影响最大。在此,进一步对两国电影进行类型分析,选取几种主要的类型(数量上较多,且相关性较高)进行分析,分别是剧情,喜剧,爱情,惊悚,动作,悬疑类电影,绘制近年来几类电影的数量变化柱状图与评分箱线图可得图12,13,14,15。

对导演与演员进行聚合,得到数据中共有15011名导演,46223名演员。按照作品数量在(0,2], (2,5], (5,10], (10,20], (20,999]进行分组统计导演数量,可以发现,15009名导演中有79.08%只拍过1-2部作品,46220名演员中有75.93%只主演过1-2部作品。忽略那些客串、跑龙套的演员,数据总体符合二八定律,即20%的人占据了行业内的大量资源。

在此,可以通过电影得分、每部电影评论人数以及电影数目寻找优秀的电影导演与演员。这三项指标分别衡量了导演/演员的创作水平,人气以及产能。考虑到电影数据集中可能有少量影视剧/剧场版动画,且影视剧/剧场版动画受众少于电影,但得分普遍要高于电影,这里根据先根据每部电影评论数量、作品数量来筛选导演/演员,再根据电影得分进行排名,并取前30名进行作图,可得图17,18。

结合电影票房网( http://58921.com/ )采集到的3353条票房数据,与豆瓣数据按照电影名称进行匹配,可以得到1995-2020年在中国大陆上映的电影信息,分别分析中国内地电影的数量、票房变化趋势,票房与评分、评价人数、时长、地区以及类型的关系,此外还给出了不同导演与演员的票房表现以及影片票房排名。

如图19所示,国内票房数据与上映的电影数量逐年递增,2020年记录的只是上半年的数据,且由于受疫情影响,票房与数量骤减。这说明在不发生重大事件的情况下,国内电影市场规模正在不断扩大。

对电影数据根据类型进行聚合,绘制散点图21,可以发现:

提取导演/演员姓名,对导演/演员字段进行聚合,计算每个导演/演员的票房总和,上映电影均分、以及执导/参与电影数目进行计算,作出票房总和前30名的导演/演员,可得图22,23,图中导演/演员标号反映了票房排名,具体每位导演/演员的上映影片数量、均分、每部电影评价人数、平均时长与总票房在表5、表6中给出。

最后根据电影票房进行排名,得到票房排名前20的电影如表格7所示,可以看到绝大部分上榜电影都是中国电影,索引序号为3、10、12、14、18、19为美国电影,这也反映了除国产电影之外,好莱坞大片占据较大的市场。

本篇报告采集了1990-2020年间豆瓣电影29033组有效数据,从豆瓣电影的评分、时长、地区、类型、演员、导演以及票房等信息进行分析评价,主要有以下结论:

阅读全文

与电影数据如何分析相关的资料

热点内容
你好李焕英电影免费观看咪咕 浏览:59
杨幂的尺度大的电影有哪些电影2015 浏览:39
2015年到2016年电影有哪些内容 浏览:741
大陆电影能在韩国播放的有哪些 浏览:228
给狗看什么电影迅雷下载地址 浏览:440
好看电影逆袭讲解 浏览:478
林芝数字电影城怎么样 浏览:962
用什么app可以看免费看电影 浏览:464
2019年好看的电影爱情 浏览:907
手机电影如何在电视看 浏览:15
如何设置电影的格式不对 浏览:734
手机播放电影如何连到电脑播放视频 浏览:707
好看点的战争动漫电影推荐 浏览:200
怎么在家里自己看电影 浏览:487
2017泰国好看的伦理电影 浏览:845
引进电影如何分成 浏览:41
一秒钟电影票免费抢入口 浏览:410
如何从社会学角度看电影 浏览:527
电影电梯什么意思 浏览:578
最新关于游戏的电影有哪些 浏览:773