導航:首頁 > 電影資訊 > 電影數據如何分析

電影數據如何分析

發布時間:2023-03-01 09:10:35

Ⅰ 從電影網站爬取數據並進行可視化分析會用到哪些數據

從電影網站爬取數據並進行可視化分析會用到的數據如下。
1、beautifulsoup、re、urllib庫。
2、SQLite包,數據可視化方面主要用到flask框架、echarts和wordcloud等。
3、此類數據可以搭建簡單的數據可視化網站。

Ⅱ 豆瓣電影數據分析報告

        近年來電影產業迅猛發展,其已成為重要的藝術和娛樂。同時,電影也是說明一個國家的經濟水平。因此分析電影書有助於電影工業的發展趨勢。

1、 每年的電影的數量,以及每年的電影平均評分

2、 電影那種類型最多,以及前三名的百分比

3、 各個國家的電影數量最多

4、 中國跟美國各個年代對比

1、 每年的電影的數量,以及每年的電影分均分

        由圖可見,從 2000 年開始電影年產量的趨勢不斷上升,而近年些年的評分越來越

低,從評分均值上看一直屬於下滑狀態。可以推測出,電影的數量會有大幅的上升,

而電影的質量整體下滑。

2、 電影那種類型最多,以及前三名的百分比

        從詞雲圖的電影類型可見,劇情、動作、喜劇的電影類型出現的頻率很高。而從環形圖

中可以看出動作、喜劇、劇情這三個電影類型對比,歷年來劇情的電影類型是最多的,其

次是喜劇,由此可以了解觀眾的喜好。

3、電影數量在前五名國家的評分情況?

從樹狀圖可以看出美國的電影數量最多,其次是中國、日本、英國、法國。

4、中國跟美國各個年代對比?

        從圖中可以看出中國的電影發展趨勢一直處以上升階段,而美國的發展趨勢不太樂

觀。以目前中國的發展趨勢很快就會追上美國,目前美國還是領先階段。

Ⅲ 票房預測數據來源

中國電影票房數據分析
2016年中國電影票房分析
據不完全統計,截止到12月29日下午6時,2016年內地電影票房已達450.76億,已超過去年票房總成績440億。其實,從2003年至2015年中國電影一直保持平均35%的市場增長率,2015年我國電影票房市場已經達到441億,過去6年復合增速38.6%。但根據目前的整體票房走勢來看,2016年的票房增速約3%,這也是17年來,我國電影票房增長最慢的一年。票房增長率13年來首次低於25%截至12月23日,2016年內地電影票房突破441億,用時358天才艱難超過了去年440.69億元的全年總票房,與2015年僅用時9個多月就超過2014年電影票房的速率相差甚遠,今年全年票房增長率13年來將首次低於25%。數據來源:中商產業研究院整理從均觀影次數來看,近年來我國平均觀影人次逐年攀升,2015年中國人均觀影次數已經達到1.6次;預計2016年中國電影觀影人次將達1.7人次,但距發達國家人均3-4次的觀影次數仍有較大差距。數據來源:中商產業研究院整理僅九部電影票房超10億另外,2016年《美人魚》、《瘋狂動物城》和《魔獸》分別以33.9億、15.3億、14.7億元的成績成為今年內地電影票房冠、亞、季軍。《美國隊長3:英雄內戰》、《西遊記之孫悟空三打白骨精》、《湄公河行動》、《澳門風雲3》、《盜墓筆記》和《功夫熊貓》劉部國產片躋身10億元俱樂部,領銜今年華語片票房排行榜。截至目前,今年共有84部在內地公映的中外電影票房過億,其中華語片共有41部過億。不過《擺渡人》、《鐵道飛虎》12月23日剛剛首映,無論口碑如何,相信兩部電影票房過億都毫無懸念。2016年度國內電影票房前十排行榜數據來源:藝恩 中商產業研究院整理(截止2016年12月30日)未來預期目前,中國電影進入繁榮發展的黃金機遇期。中國電影產量位居全球第三,今年中國電影產量不減,預計年底將突破700部。今年電影市場增長速度減緩,但依然在增長。預計,2016年電影市場或將達到454億,增速3%,增長速度略緩。
另外,相關數據顯示,今年有84部影片過億,相比去年的81部有所提高。觀影人數約在13億,比去年12億也有所增長。而12月下旬,國家新聞出版廣電總局發布最新數據,中國電影銀幕已超過4萬塊,躍居世界第一。2016年,中國電影銀幕以每天增加26塊的速度遞增,超過了2015年每天增加22塊的速度。值得關注的是:近期,阿里巴巴影業聯合上戲、復星探索影視人才培養新模式。蘋果收購已破產流媒體音樂公司,吸收技術和人才;Instagram也將推出直播功能。這些都反映我國影視傳媒行業市場前景可期。中商產業研究院簡介中商產業研究院是深圳中商情大數據股份有限公司下轄的研究機構,研究范圍涵蓋智能裝備製造、新能源、新材料、新金融、新消費、大健康、「互聯網+」等新興領域。公司致力於為國內外企業、上市公司、投融資機構、會計師事務所、律師事務所等提供各類數據服務、研究報告及高價值的咨詢服務。中商行業研究服務內容行業研究是中商開展一切咨詢業務的基石,我們通過對特定行業長期跟蹤監測,分析行業需求、供給、經營特性、盈利能力、產業鏈和商業模式等多方面的內容,整合行業、市場、企業、用戶等多層面數據和信息資源,為客戶提供深度的行業市場研究報告,全面客觀的剖析當前行業發展的總體市場容量、競爭格局、進出口情況和市場需求特徵等,對行業重點企業進行產銷運營分析,並根據各行業的發展軌跡及實踐經驗,對各產業未來的發展趨勢做出准確分析與預測。中商行業研究報告是企業了解各行業當前最新發展動向、把握市場機會、做出正確投資和明確企業發展方向不可多得的精品資料。中商行業研究方法中商擁有10多年的行業研究經驗,利用中商Askci資料庫立了多種數據分析模型,在產業研究咨詢領域利用行業生命周期理論、SCP分析模型、PEST分析模型、波特五力競爭分析模型、SWOT分析模型、波士頓矩陣、國際競爭力鑽石模型等、形成了自身獨特的研究方法和產業評估體系。在市場預測分析方面,模型涵蓋對新產品需求預測、快速消費品銷售預測、市場份額預測等多種指標,實現針對性的進行市場預測分析。
中商研究報告數據及資料來源中商利用多種一手及二手資料來源核實所收集的數據或資料。一手資料來源於中商對行業內重點企業訪談獲取的一手信息數據;中商通過行業訪談、電話訪問等調研獲取一手數據時,調研人員會將多名受訪者的資料及意見、多種來源的數據或資料進行比對核查,公司內部也會預先探討該數據源的合法性,以確保數據的可靠性及合法合規。二手資料主要包括國家統計局、國家發改委、商務部、工信部、農業部、中國海關、金融機構、行業協會、社會組織等發布的各類數據、年度報告、行業年鑒等資料信息。
數據來源 數據種類
金融機構 金融機構公開發布的各類年度數據、季度數據、月度數據等
政府部門 宏觀經濟數據、行業經濟數據、產量數據、進出口貿易數據等
行業協會 年度報告數據、公報數據、行業運行數據、會員企業數據等
社會組織 國際性組織、社會團體公布的各類數據等
行業年鑒 農業、林業、醫療、衛生、教育、環境、裝備、房產、建築等各類行業數據
公司公告 資本市場各類公司發布的定期年報、半年報、公司公告等
期刊雜志 在開期刊雜志中獲取的僅限於允許公開引用、轉載的部分
中商調研 研究人員、調研人員通過實地調查、行業訪談、獲取的一手數據
中商的產業研究服務優勢
產業研究優勢 優勢體現
豐富的數據資源、強大數據挖掘能力 中商是中國首家自建資料庫系統的產業研究咨詢機構,公司自主研發的Askci資料庫和CISource中商情報通對各類數據建立中商企業資料庫、全球資料庫、宏觀經濟資料庫、行業資料庫、區域資料庫、調研資料庫等專業資料庫,覆蓋近5000多個細分產業數據。
知名的研究團隊,優質的研究咨詢服務 中商擁有具備專業背景知識和熟悉產業運營的復合型人才, 產業分析師、行業專家及咨詢顧問共計300餘名,在宏觀經濟、區域經濟、細分行業及政策法規研究方面具備很強的實力。公司研究團隊為客戶提供專業的產業研究咨詢服務及個性化的專項咨詢服務。
專門的客服團隊,滿足客戶個性化咨詢服務 公司建立了專門的客服團隊,能夠更為准確的了解客戶的需求並滿足,並且能夠對客戶的需求進行快速的處理,深入為客戶提供多樣化、個性化產品解決方案。通過加強員工培訓與業務創新,開創了民營銀行籌建、保險公司籌建等新型咨詢服務業務。
產業大數據平台成就最具影響力行業門戶 公司旗下中商情報網是是國內專業的商業大數據發布和查詢平台,經過多年的發展吸引培養了一批忠實用戶,已成為中國財經領域「最具影響力行業門戶」,為國內外企業、金融從業人員、創業人員、科研院所工作者等提供客觀、時效、高價值的商業資訊。
中商的影響力國家政府部門及權威媒體廣泛報道與引用中商產業研究院專業研究結論國內外主流財經媒體及國家政府部門大量引用中商數據及研究結論,如央視財經、鳳凰財經新浪財經、中國經濟信息網、國家商務部、發改委、國務院發展研究中心(國研網)等。

5
網路文庫VIP限時優惠現在開通,立享6億+VIP內容
立即獲取
中國電影票房數據分析
2016年中國電影票房分析
第 1 頁
據不完全統計,截止到12月29日下午6時,2016年內地電影票房已達450.76億,已超過去年票房總成績440億。其實,從2003年至2015年中國電影一直保持平均35%的市場增長率,2015年我國電影票房市場已經達到441億,過去6年復合增速38.6%。但根據目前的整體票房走勢來看,2016年的票房增速約3%,這也是17年來,我國電影票房增長最慢的一年。
票房增長率13年來首次低於25%
截至12月23日,2016年內地電影票房突破441億,用時358天才艱難超過了去年440.69億元的全年總票房,與2015年僅用時9個多月就超過2014年電影票房的速率相差甚遠,今年全年票房增長率13年來將首次低於25%。
第 2 頁
數據來源:中商產業研究院整理
從均觀影次數來看,近年來我國平均觀影人次逐年攀升,2015年中國人均觀影次數已經達到1.6次;預計2016年中國電影觀影人次將達1.7人次,但距發達國家人均3-4次的觀影次數仍有較大差距。
第 3 頁
數據來源:中商產業研究院整理
僅九部電影票房超10億
另外,2016年《美人魚》、《瘋狂動物城》和《魔獸》分別以33.9億、15.3億、14.7億元的成績成為今年內地電影票房冠、亞、季軍。《美國隊長3:英雄內戰》、《西遊記之孫悟空三打白骨精》、《湄公河行動》、《澳門風雲3》、《盜墓筆記》和《功夫熊貓》劉部國產片躋身10億元俱樂部,領銜今年華語片票房排行榜。
截至目前,今年共有84部在內地公映的中外電影票房過億,其中華語片共有41部過億。不過《擺渡人》、《鐵道飛虎》12月23日剛剛首映,無論口碑如何,相信兩部電影票房過億都毫無懸念。

Ⅳ Python分析44130條用戶觀影數據,挖掘用戶與電影之間的隱藏信息!

很多電影也上映,看電影前很多人都喜歡去 『豆瓣』 看影評,所以我爬取44130條 『豆瓣』 的用戶觀影數據,分析 用戶之間 的關系, 電影之間 的聯系,以及 用戶和電影之間 的隱藏關系。

在****『豆瓣』****平台爬取用戶觀影數據。

為了獲取用戶,我選擇了其中一部電影的影評,這樣可以根據評論的用戶去獲取其用戶名稱(**後面爬取用戶觀影記錄只需要****『用戶名稱』******)。

url中start參數是頁數(page 20,每一頁20條數據),因此start=0、20、40...,也就是 20的倍數 ,通過改變start參數值就可以獲取這 4614條用戶的名稱。 *

查看網頁的標簽,可以找到******『用戶名稱』******值對應的標簽屬性。

上一步爬取到****『用戶名稱』****,接著爬取用戶觀影記錄需要用到****『用戶名稱』。****

[圖片上傳失敗...(image-65a80e-1624889400616)]

通過改變****『用戶名稱』****,可以獲取到不同用戶的觀影記錄。

url中start參數是頁數(page 15,每一頁15條數據),因此start=0、15、30...,也就是 15的倍數 ,通過改變start參數值就可以獲取這 1768條觀影記錄稱。 *

查看網頁的標簽,可以找到****『電影名』****值對應的標簽屬性。

excel表有兩個標題(用戶, 影評)

定義了寫入excel函數,這樣爬起每一頁數據時候調用寫入函數將數據保存到excel中。

最後採集了44130條數據(原本是4614個用戶,每個用戶大約有500~1000條數據,預計 400萬條數據 )。但是為了演示分析過程,只爬取每一個用戶的前30條觀影記錄( 因為前30條是最新的 )。

最後這44130條數據會在 下面分享給大家

從豆瓣.xls中讀取全部數據放到datalist集合中。

以用戶 『mumudancing』 為例進行用戶畫像

以用戶 『mumudancing』 為例,對用戶之間進行 電影推薦

以電影 『送你一朵小紅花』 為例,對電影之間進行 電影推薦

Ⅳ 豆瓣電影數據分析的背景與意義

豆瓣電影數據分析的背景與意義是電影發展的衡量標准。根據查詢相關資料信息顯示:豆瓣已經成為國內電影愛好者、影評人士的聚集地,豆瓣評分已經成為國內一個評價電影的重要指標,豆瓣上積攢了大量電影數據為電影行業分析提供了重要資源,通過豆瓣電影來衡量國內外的電影的發展情況。

Ⅵ 電影評分數據統計分析的作用和意義

通過觀眾對電影的評分的分析,可以在一定程度上給電影行業啟發。數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,將它們加以匯總和理解並消化,以求最大化地開發數據的功能,發揮數據的作用。數據分析是為了提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。

Ⅶ 11月電影市場數據分析哪裡

中商情報網訊:10月全國票房最終收官於36.44億,同比下降29.3%,創下2016年9月之後,整整兩年來的單月跌幅之最。在經過7月和8月暑期檔單月大盤連續兩個月逼近70億大關後,後期電影票房明顯下沉。目前已進入到2018年第四季度,但電影市場還是保持著一貫的冷漠。不過在國慶假期的加持下,10月票房相比9月30.99億元來說,環比增長17.6%;單月觀影人次為10531萬人,環比增長19.82%;10月電影上映場次983.15萬場,比9月上映場次增加了85.17萬場。2018年1-10月全國市場共產出綜合票房約525億元。
2018年1-10月票房收入突破525億
中國電影產業在國民經濟新的發展形勢下實現了穩健增長。以電影票房收入衡量,我國電影市場已經成為僅次於美國的全球第二大電影市場。統計數據顯示,我國電影票房市場近年來保持高速增長的態勢,觀影人次從2007年的0.71億,增長2016年的13.72億,年均復合增長率達到34.47%。國內電影票房從2012年的170.7億元增長到2017年559.1億元,年均復合增長率達到26.78%。2018年1-10月全國電影票房累計達525.3億元。按照今年電影票房趨勢來看,2018年全國電影票房超越2017年的559.1億元基本是毫無壓力。
數據來源:中商產業研究院整理
10月電影市場凄慘收官 同比大降29.3%
根據貓眼專業版數據,2018年10月電影票房共計36.44億元,較去年同期51.53億元票房,同比下降29.3%。10月上映影片中,國慶檔影片《無雙》《影》等影片票房居前。
除4月票房有所下滑外,2018年單月票房都取得較好的成績,其中2月101億票房位居榜首,這無疑給2018年電影市場帶來了一個良好的開端!2018年上半年電影市場大漲18%,進入到暑期檔7月-8月,票房再次實現大漲,其中7月同比增長37.9%至69.5億元,僅次於春節檔2月票房,到8月票房同比略有下滑。9月票房下沉明顯,環比大降54.6%。10月在國慶假期加持下票房環比增長17.6%。但卻是2016年9月之後,整整兩年來的單月同比跌幅之最。
數據來源:貓眼、藝恩、中商產業研究院整理
《無雙》單月票房第一《影》排名第二
在2018年10月電影票房排行榜上,榜單前十部影片中有7部電影票房都在1億元之上,3部影片超3億大關。其中庄文強執導的犯罪題材港片《無雙》以票房11.69億霸佔月度冠軍之位。該片9月底上映累計票房順利破10億,累計分賬票房成功超越《澳門風雲3》(11.16億),打破發哥演員生涯的內地票房紀錄。截至11月1日14:30,該片連續24日獲得單日票房冠軍,累計綜合票房達到12.26億元,分賬票房11.3億元,貓眼評分高達8.9分,口碑與票房雙豐收。
影片《影》單月票房第二,10月票房為5.59億元,貓眼評分8.2分。作為張藝謀申奧影片,《影》自籌拍時期就成為相關媒體的聚焦點。盡管《影》在視覺上追求的以水墨風格形成的形式化美感再次以極致表現給觀眾留下深刻印象,但這部作品並未給觀眾帶來更多的驚喜和震撼。月度排名第三的是開心麻花團隊的喜劇片《李茶的姑媽》,10月累計票房4.95億元,貓眼評分7.9分。《找到你》票房第四,10月累計票房2.67億元。《胖子行動隊》以2.28億元票房排名第五,《鐵血戰士》10月票房拿下1.72億元,排名第六。
數據來源:貓眼、中商產業研究院整理
前三電影票房佔比超六成
10月全國電影票房分布集中在國慶檔影片,排名前五部都是國慶檔電影。其中《無雙》單月占據總票房32.1%,《影》佔比15.3%,《李茶的姑媽》佔13.6%。排名前三位的電影票房佔比合計占當月總票房的61.3%。
數據來源:貓眼、中商產業研究院整理
11月上映電影前瞻
從陣容來看,11月進口片是迪士尼與華納兄弟在國內電影市場的一次交鋒。迪士尼在月初與月末先後上映真人童話電影《胡桃夾子與四個國王》與經典動畫續集電影《無敵破壞王2:大鬧互聯網》。華納兄弟則發力下半場,在月中與月末先後上映《神奇動物:格林德沃之罪》與亞裔陣容的喜劇愛情電影《摘金奇緣》。另外《毒液》作為「蜘蛛俠宇宙」中的非典型英雄,該片北美市場目前累計票房達到1.87億美元。值得一提的是,目前《毒液》聯合火箭少女101推出的推廣歌曲《毒液前來》成功引起公眾注意,貓眼想看人數超過30萬,11月進口片中人數最高。11月上映影片信息一起來看一下吧!
資料來源:貓眼、中商產業研究院整理
更多資料請參考中商產業研究院發布的《2018-2023年中國電影行業發展前景及投資機會分析報告》。

Ⅷ 豆瓣電影數據分析

這篇報告是我轉行數據分析後的第一篇報告,當時學完了Python,SQL,BI以為再做幾個項目就能找工作了,事實上……分析思維、業務,這兩者遠比工具重要的多。一個多月後回過頭來看,這篇報告雖然寫得有模有樣,但和數據分析報告還是有挺大差別的,主要原因在於:a.只是針對豆瓣電影數據分析太過寬泛了,具體關鍵指標到底是哪些呢?;b.沒有一個確切有效的分析模型/框架,會有種東一塊西一塊的拼接感。
即便有著這些缺點,我還是想把它掛上來,主要是因為:1.當做Pandas與爬蟲(Selenium+Request)練手,總得留下些證明;2.以豆瓣電影進行分析確實很難找到一條業務邏輯線支撐,總體上還是描述統計為主;3.比起網上能搜到的其他豆瓣電影數據分析,它更為詳細,可視化效果也不錯;

本篇報告旨在針對豆瓣電影1990-2020的電影數據進行分析,首先通過編寫Python網路爬蟲爬取了51375條電影數據,採集對象包括:電影名稱、年份、導演、演員、類型、出品國家、語言、時長、評分、評論數、不同評價佔比、網址。經過去重、清洗,最後得到29033條有效電影數據。根據電影評分、時長、地區、類型進行分析,描述了評分與時長、類型的關系,並統計了各個地區電影數量與評分。之後,針對演員、導演對數據進行聚合,給出產量與評分最高的名單。在分析過程中,還發現電影數量今年逐步增加,但評分下降,主要原因是中國地區今年低質量影視作品的增加。

另外,本篇報告還爬取了電影票房網( http://58921.com/ )1995-2020年度國內上映的影片票房,共採集4071條數據,其中3484條有效。進一步,本文分析了國內院線電影票房年度變化趨勢,票房與評分、評價人數、時長、地區的關系,票房與電影類型的關聯,並給出了票房最高的導演、演員與電影排名。

清洗、去重後,可以看到29033條數據長度、評分、評論數具有以下特點:

結合圖1(a)(b)看,可以看到電影數據時長主要集中在90-120分鍾之間,向兩極呈現階梯狀遞減,將數據按照短(60-90分鍾),中(90-120分鍾),長(120-150分鍾),特長(>150分鍾)劃分,各部分佔比為21.06%, 64.15%, 11.95%, 2.85%。

結合圖2(a)看,可以看到我們採集到的電影數據評分主要集中在6.0-8.0之間,向兩極呈現階梯狀遞減,在此按照評分劃分區間:2.0-4.0為口碑極差,4.0-6.0為口碑較差,6.0-7.0為口碑尚可,7.0-8.0為口碑較好,8.0-10.0為口碑極佳。

這5種電影數據的佔比分別為:5.78%, 23.09%, 30.56%, 29.22%, 11.34%

再將評分數據細化到每年進行觀察,可以發現,30年內電影數量與年度電影均分呈反相關,年度均分整體呈現下降趨勢,2016年電影均分最低,電影數量最多。

進一步做出每個年份下不同評級等級的電影數據佔比,可以發現,近年來,評分在[2.0,6.0)的電影數據佔比有著明顯提升,評分在[6.0,7.0)的數據佔比不變,評分在[7.0,10.0)的數據佔比減少,可能原因有:

對照圖5,可以發現,評分與時長、評論人數的分布大致呈現漏斗狀,高分電影位於漏鬥上部,低分電影位於漏斗下部。這意味著,如果一部電影的評論人數很多(特別是超過30w人觀影),時長較長(大於120min),那麼它大概率是一部好電影。

根據各個國家的電影數量作圖,可以得到圖6,列出電影數量前十的國家可得表格2,發現美國在電影數量上占第一,達到8490部,中國其次,達6222部。此外,法國,英國,日本的電影數量也超過1000,其餘各國電影數量相對較少。這可以說明美國電影有著較大的流量輸入,在中國產生了較大的影響。

進一步分析各國電影的質量,依據評分繪制評分箱線圖可得圖7,在電影數量排名前20的國家中:

接著我們可以探索,哪個國家的電影對豆瓣評分隨年份下降的貢獻最大,考慮到電影數量對應著評分的權重。根據上述各國的電影評分表現,我們可以猜測電影數量較多的國家可能對年度均分的下降有較大影響。於是,我們再計算出這些國家的年度電影均分,並與整體均分進行比較分析。

再作出中國大陸,中國台灣,中國香港的均分箱線圖圖9(a),可以看到,大陸電影均分低於港台電影,且存在大量低分電影拉低了箱體的位置。

分析相關性可得,大陸、香港、台灣電影年度均分與全部評分關聯度分別為R=0.979,0.919,0.822,說明濾去台灣和香港電影,大陸電影年度均分的變化趨勢與全部評分變化更接近。圖9(b)可以進一步反映這一點。

可以看到,大部分類型集中在X×Y=[10000,30000]×[6.00,7.50]的區間范圍內,劇情、喜劇、愛情、犯罪、動作類電影數量上較多,說明這些題材的電影是近三十年比較熱門的題材,其中劇情類電影佔比最多,音樂、傳記類電影平均得分更高,但在數量上較少,動作、驚悚類電影評論人數雖多,但評價普遍偏低。

除此之外,還有兩塊區域值得關註:

根據類型對電影數據進行聚合,整理得到各類型電影評分的時間序列,計算它們與整體均分時間序列的相關性,可得表格4與圖11,可以看到劇情,喜劇,懸疑這三種類型片與總分趨勢變化相關性最強,同時劇情、喜劇類電影在電影數量上也最多,因此可以認為這兩類電影對於下跌趨勢影響最大,但其餘類別電影的相關性也達到了0.9以上,說明幾種熱門的電影得分的變化趨勢與總體均分趨勢一致。

前面已經得知,中美兩國電影佔比最高,且對於均分時間序列的影響最大。在此,進一步對兩國電影進行類型分析,選取幾種主要的類型(數量上較多,且相關性較高)進行分析,分別是劇情,喜劇,愛情,驚悚,動作,懸疑類電影,繪制近年來幾類電影的數量變化柱狀圖與評分箱線圖可得圖12,13,14,15。

對導演與演員進行聚合,得到數據中共有15011名導演,46223名演員。按照作品數量在(0,2], (2,5], (5,10], (10,20], (20,999]進行分組統計導演數量,可以發現,15009名導演中有79.08%只拍過1-2部作品,46220名演員中有75.93%只主演過1-2部作品。忽略那些客串、跑龍套的演員,數據總體符合二八定律,即20%的人占據了行業內的大量資源。

在此,可以通過電影得分、每部電影評論人數以及電影數目尋找優秀的電影導演與演員。這三項指標分別衡量了導演/演員的創作水平,人氣以及產能。考慮到電影數據集中可能有少量影視劇/劇場版動畫,且影視劇/劇場版動畫受眾少於電影,但得分普遍要高於電影,這里根據先根據每部電影評論數量、作品數量來篩選導演/演員,再根據電影得分進行排名,並取前30名進行作圖,可得圖17,18。

結合電影票房網( http://58921.com/ )採集到的3353條票房數據,與豆瓣數據按照電影名稱進行匹配,可以得到1995-2020年在中國大陸上映的電影信息,分別分析中國內地電影的數量、票房變化趨勢,票房與評分、評價人數、時長、地區以及類型的關系,此外還給出了不同導演與演員的票房表現以及影片票房排名。

如圖19所示,國內票房數據與上映的電影數量逐年遞增,2020年記錄的只是上半年的數據,且由於受疫情影響,票房與數量驟減。這說明在不發生重大事件的情況下,國內電影市場規模正在不斷擴大。

對電影數據根據類型進行聚合,繪制散點圖21,可以發現:

提取導演/演員姓名,對導演/演員欄位進行聚合,計算每個導演/演員的票房總和,上映電影均分、以及執導/參與電影數目進行計算,作出票房總和前30名的導演/演員,可得圖22,23,圖中導演/演員標號反映了票房排名,具體每位導演/演員的上映影片數量、均分、每部電影評價人數、平均時長與總票房在表5、表6中給出。

最後根據電影票房進行排名,得到票房排名前20的電影如表格7所示,可以看到絕大部分上榜電影都是中國電影,索引序號為3、10、12、14、18、19為美國電影,這也反映了除國產電影之外,好萊塢大片占據較大的市場。

本篇報告採集了1990-2020年間豆瓣電影29033組有效數據,從豆瓣電影的評分、時長、地區、類型、演員、導演以及票房等信息進行分析評價,主要有以下結論:

閱讀全文

與電影數據如何分析相關的資料

熱點內容
陌陌上怎麼分享電影 瀏覽:811
和鬼賭博的電影有哪些 瀏覽:409
南瓜電影怎麼跳過片頭 瀏覽:952
u盤電影插入電視機如何播放 瀏覽:261
搞笑免費老電影 瀏覽:936
途銳如何連接手機電影 瀏覽:628
生化危機2免費觀看八哥電影完整版 瀏覽:436
電影重裝機兵免費觀看 瀏覽:905
韓國電影小鎮免費觀看 瀏覽:350
陰陽師電影鄧倫免費 瀏覽:33
瘋狂電影院怎麼拍高票房電影 瀏覽:874
哪些未刪減電影推薦 瀏覽:571
電影多哥好看嗎 瀏覽:134
好看的電影美國喪屍 瀏覽:902
唐人街探案電影3在哪免費看 瀏覽:288
電影香港恐怖片女色鬼免費看 瀏覽:897
最近有哪些新出的電影 瀏覽:949
好看的歐特曼電影 瀏覽:677
你怎麼一個人看電影 瀏覽:112