作者:澤龍、Mika
數(shù)據(jù):真達(dá)
后期:澤龍
【導(dǎo)語】:今天我們來聊一聊鑒寶題材網(wǎng)劇《古董局中局2》,Python技術(shù)部分請看第四部分。公眾號后臺,回復(fù)關(guān)鍵字“古董”獲取完整數(shù)據(jù)。
Show me data,用數(shù)據(jù)說話
今天我們聊一聊《古董局中局2》
點(diǎn)擊下方視頻,先睹為快:
上周日,有一部鑒寶題材的劇靜悄悄上線了,那就是夏雨、魏晨等主演的古董局中局系列第二部《古董局中局2鑒墨尋寶》(下文簡稱為《古2》)。
這部劇制作團(tuán)隊(duì)是《怒晴湘西》《龍嶺迷窟》等網(wǎng)劇的經(jīng)典配置——管虎監(jiān)制+費(fèi)振翔導(dǎo)演。按理說有了《龍嶺迷窟》的成功,費(fèi)振翔導(dǎo)演應(yīng)該更加得心應(yīng)手,但是《古2》的就完全沒有《龍嶺迷窟》給人帶來的驚艷感了,有些地方還有點(diǎn)不盡人意。
經(jīng)典鑒寶題材IP
從小說到桌游
首先要給不知道《古董局中局》的小伙伴們科普下,《古董局中局》一共4部,是馬伯庸執(zhí)筆的,小說連載后就引起了熱潮,備受追捧。
因?yàn)轭}材和劇情設(shè)置,被知名桌游公司改編成了桌游,更在當(dāng)時風(fēng)靡一時,各大桌游店都在玩古董局中局,最后騰訊出手,買下版權(quán),改編成了電視劇。
關(guān)于《古董局中局》桌游的玩法,簡單介紹下就是分為紅黑兩個陣營,紅方以許愿為代表,家族遭到黑方陷害,想為家族平冤昭雪,以打敗黑方為己任。黑方以老朝奉為代表,想統(tǒng)治古玩市場,勢力通天,雙方誰都不知道對方的真實(shí)身份,在各種古玩案件里面斗智斗勇。
02
豆瓣7.1分
《古2》拍的怎么樣
其實(shí)這并不是《古董局中局》第一次影視化,在2018年時就由夏雨、喬振宇、蔡文靜主演了第一部,劇情較原著改編幅度較大,而且后期劇情較為冗雜拖沓,無關(guān)緊要、可有可無的場面和對話太多,導(dǎo)致劇情崩壞,最終豆瓣評分只有6.7分。
本次第二部依舊夏雨飾演主角許愿,而其他配角都大換血,藥不然和黃煙煙分別換成了阿麗亞。
故事主要根據(jù)原著第二部和第四部的內(nèi)容,講的是夏雨飾演的許愿是北京潘家園小古董店"四悔齋"的老板,古董鑒寶界最具權(quán)威的"五脈梅花"家族之一許家,唯一的傳人。為了楸出隱藏在五脈之中的"老朝奉"造假勢力,許愿孤身一人入局破局,與龐大的古董造假集團(tuán)展開層層較量,卻被設(shè)局指引牽扯出兩幅《清明上河圖》真贗難辨的驚天秘密。
夏雨的痞勁真是高度還原原著書中許愿,一看就是胡同串子,但是第二部女主換人,看看網(wǎng)上的評價,吐槽不少。
劇情方面雖然也存在各種槽點(diǎn),但是這部劇后面還是高度還原小說的,現(xiàn)在豆瓣評分也穩(wěn)定在7.1分,成績還是不錯的。
我們分析整理了《古2》在豆瓣的評分?jǐn)?shù)據(jù):
總體評分情況
首先看到總體評分情況,其中給四星的最多,共占31.8%,其次20.8%的人給出了3星,19.6%的人給出了2星。
短評詞云
在豆瓣大家對這部劇的評價如何呢?
通過分析豆瓣的短評可以看到,討論最多的就是夏雨的演技,夏雨的演技還是有保障的。同時女主黃煙煙也是討論的焦點(diǎn)之一,在許多書迷看來,黃煙煙本是個冰山美人,現(xiàn)在怎么變成一這么活潑的北京妞兒?實(shí)在是有點(diǎn)不符合人設(shè)。
除此之外,詞云針對“劇情”“原著”方面的討論很多,除了吐槽,評論中表示“喜歡”“不錯”等肯定的聲音也不少。
03
看《古2》時
彈幕中大家都在討論些什么
接著我們來分析下這部劇在騰訊視頻的彈幕數(shù)據(jù),這次我們還是用的Python,我們總共收集整理了107570 條彈幕。
彈幕字?jǐn)?shù)分布
下面看到分析結(jié)果,首先在彈幕發(fā)送的數(shù)據(jù)上很有意思,發(fā)送彈幕字?jǐn)?shù)最多的不是5字以下,而是5-10字,這部分彈幕共有38107條,其次10-15字的彈幕也不少,為27948條。
單人彈幕發(fā)送量
看劇時大家發(fā)彈幕的習(xí)慣又如何呢?通過分析可以發(fā)現(xiàn),高達(dá)58.73%的人都只發(fā)了一條彈幕。17.95%的人發(fā)了兩條彈幕。
彈幕關(guān)注人物分布
發(fā)彈幕時,大家討論的主要人物都有哪些呢?經(jīng)過數(shù)據(jù)分析整理可以發(fā)現(xiàn),討論最多的當(dāng)然是我們的男主夏雨。其次分別是魏晨、老朝奉、阿麗亞等演員。
人物彈幕畫像
夏雨飾演--許愿
先看到夏雨飾演的許愿這一角色彈幕畫像,彈幕中觀眾們都對夏雨的演技表示了肯定,“厲害”“好看”“喜歡”等都是高頻詞。夏雨不必多說,影帝就是影帝,演技一如既往得穩(wěn)。總之,夏雨把許愿這個有點(diǎn)吊兒郎當(dāng)?shù)莾?nèi)心又充滿著正義感和使命感的北京小青年演繹得淋漓盡致。
魏晨飾演--藥不然
關(guān)于魏晨飾演的藥不然,觀眾們認(rèn)為,雖然比起第一部少了點(diǎn)貴公子的感覺,但魏晨版藥不然也還不錯,藥不然的玩世不恭、混不吝都變現(xiàn)的很有分寸。評論中感嘆魏晨演技還不錯,演出了“痞帥”的感覺,還挺令人眼前一亮。同時也有跟第一部喬振宇版進(jìn)行對比的。
阿麗亞飾演--黃煙煙
最后看到阿麗亞飾演的黃煙煙角色詞云,這個角色的爭議就很大了。比起第一部冷若冰霜的冰山美人,這一部版的黃煙煙轉(zhuǎn)眼變成了活潑的北京大妞。這方面還是讓觀眾們挺難接受的。在詞云中感嘆“一言難盡”“出戲”“失望”的詞頻出。
04
教你用Python分析
《古2》騰訊視頻彈幕
關(guān)于數(shù)分析部分,我們獲取了騰訊彈幕的數(shù)據(jù)并進(jìn)行了以下的分析,以下為部分分析代碼。
首先導(dǎo)入數(shù)據(jù)處理和相關(guān)的繪圖庫。
# 導(dǎo)入庫
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import jieba
import jieba.analyse
from snownlp import SnowNLP
from pyecharts.charts import Bar, Pie, Line, WordCloud, Page
from pyecharts import options as opts
爬取到的彈幕是這樣子的,一共包含了以下信息:集數(shù)、評論ID、用戶名、vip等級、評論內(nèi)容、評論時間點(diǎn)和評論點(diǎn)贊。
# 讀入數(shù)據(jù)
df_1 = pd.read_csv('./data/古董局中局2騰訊彈幕.csv', encoding='utf-8', engine='python')
df_1.head()
一共有107570條彈幕數(shù)據(jù)。
df_1.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 107570 entries, 0 to 107569
Data columns (total 7 columns):
episodes 107570 non-null int64
comment_id 107570 non-null int64
oper_name 25539 non-null object
vip_degree 107570 non-null int64
content 107570 non-null object
time_point 107570 non-null int64
up_count 107570 non-null int64
dtypes: int64(5), object(2)
memory usage: 5.7+ MB
# 計算字?jǐn)?shù)
word_num = df_1['content'].apply(lambda x:len(x))
# 分箱
bins = [0,5,10,15,20,25,30,35,40,45,50,549]
word_num_cut = pd.cut(word_num, bins).value_counts().sort_index()
# 柱形圖
bar1 = Bar(init_opts=opts.InitOpts(width='1350px', height='750px'))
bar1.add_xaxis(word_num_cut.index.astype('str').tolist())
bar1.add_yaxis("", word_num_cut.values.tolist(), category_gap='4%')
bar1.set_global_opts(title_opts=opts.TitleOpts(title="彈幕發(fā)送字?jǐn)?shù)分布"),
visualmap_opts=opts.VisualMapOpts(max_=38107)
)
bar1.render()
def nlp_score(x):
"""
功能:獲取情感評分
"""
sn = SnowNLP(x)
return sn.sentiments
# 計算情感得分
df_1['nlp_score'] = df_1['content'].map(lambda x: nlp_score(x))
# 分箱
score_bins = [0,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1]
score_cut = pd.cut(df_1['nlp_score'], bins=score_bins)
score_cut = score_cut.value_counts().sort_index()
# 繪制折線圖
line1 = Line(init_opts=opts.InitOpts(width='1350px', height='750px'))
line1.add_xaxis(score_cut.index.astype('str').tolist())
line1.add_yaxis('', score_cut.values.tolist(),
areastyle_opts=opts.AreaStyleOpts(opacity=0.5),
label_opts=opts.LabelOpts(is_show=False))
line1.set_global_opts(title_opts=opts.TitleOpts(title='彈幕情感評分分布[0~1]'),
# toolbox_opts=opts.ToolboxOpts(),
visualmap_opts=opts.VisualMapOpts(max_=22288))
line1.set_series_opts(linestyle_opts=opts.LineStyleOpts(width=4))
line1.render()
def calculate_nums(words_list):
"""
功能:給定關(guān)鍵詞列表,計算彈幕出現(xiàn)次數(shù)
"""
pattern = '|'.join(words_list)
num = int(df_1['content'].str.contains(pattern).sum())
return num
# 關(guān)鍵詞
xiayu = ['許愿', '夏雨', '下雨']
weichen = ['藥不然', '魏晨', '藥二爺', '晨晨', '老魏', '晨哥', '晨']
laochaofeng = ['老朝奉', '老朝鳳', '老朝', '老嘲諷', '老巢']
Aliya = ['黃煙煙', '阿麗亞', '煙煙']
liangjing = ['梁靜', '素姐']
liuyiming = ['一鳴', '畢彥君']
all_list = [xiayu, weichen, laochaofeng, Aliya, liangjing, liuyiming]
danmu_name = ['夏雨', '魏晨', '老朝奉', '阿麗亞', '梁靜', '劉一鳴']
danmu_num = [calculate_nums(i) for i in all_list]
# 柱形圖
bar2 = Bar(init_opts=opts.InitOpts(width='1350px', height='750px'))
bar2.add_xaxis(danmu_name)
bar2.add_yaxis('數(shù)量', danmu_num)
bar2.set_global_opts(title_opts=opts.TitleOpts('彈幕主要關(guān)注人物分布'),
visualmap_opts=opts.VisualMapOpts(max_=20000))
bar2.render()
結(jié)語
目前這部《古2》還在更新中,大家可以等都更新完了在看,畢竟免費(fèi)看劇難道不香嗎?同時C君在這里還是很推薦大家去玩下這個《古董局中局》的桌游,的確比較燒腦的。
本文出品:CDA數(shù)據(jù)分析師(ID: cdacdacda)