国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
大數(shù)據(jù)背景下的暢銷書選題技術(shù)操作

摘要:在大數(shù)據(jù)背景下,透過簡單的學(xué)習(xí)或以低廉的成本外包數(shù)據(jù)公司設(shè)計(jì)出符合自己的數(shù)據(jù)挖掘程序,編輯就能靠自己的力量從網(wǎng)絡(luò)上免費(fèi)獲取許多有用的數(shù)據(jù),并將下載的數(shù)據(jù)依照自己的編輯經(jīng)驗(yàn)分析出在選題策劃時(shí)有用的資訊。本文針對編輯選題策劃時(shí)的幾個(gè)關(guān)鍵點(diǎn),一一說明可行的操作方式,提出每一位編輯都應(yīng)該自己掌握分析數(shù)據(jù)能力的論點(diǎn)。唯有如此,編輯才能將自身的經(jīng)驗(yàn)帶入數(shù)據(jù)分析工作,在大數(shù)據(jù)時(shí)代以更加有效和科學(xué)的方式執(zhí)行選題策劃工作。大數(shù)據(jù)不能完全取代編輯的經(jīng)驗(yàn),但能有效提升編輯打造暢銷書的效率與概率。

關(guān)鍵詞:大數(shù)據(jù)?暢銷書?編輯?選題

中圖分類號:G232

累積大量用戶資料所產(chǎn)生的大數(shù)據(jù),使曾經(jīng)深藏于用戶心中,甚至連用戶自身也并不十分明白的偏好,變得不再是秘密。許多媒介漸漸可以根據(jù)長期累積的用戶數(shù)據(jù),投其所好地為受眾打造“定制”的內(nèi)容。在傳媒領(lǐng)域近年最常被提及的案例,莫過于從出租影片DVD業(yè)務(wù)起家,近年靠著其累積多年的龐大用戶數(shù)據(jù),成功由內(nèi)容通路商轉(zhuǎn)型成內(nèi)容制造商,并靠著一系列暢銷原創(chuàng)作品成功躋身于好萊塢新六大影視公司的Netflix。顯然大數(shù)據(jù)最大的貢獻(xiàn)并不只在看清過去和現(xiàn)在,或者說利用大數(shù)據(jù)看清過去和現(xiàn)在的目的是能成功地預(yù)測未來。處身于大數(shù)據(jù)時(shí)代背景下的出版行業(yè),是不是也能在有限的資源下借助大數(shù)據(jù)的力量,幫助編輯更有效率地提高打造暢銷書的概率?這是本文關(guān)心的問題。
筆者嘗試以自己在出版社企劃編輯崗位上的工作經(jīng)驗(yàn),站在單一編輯的立場去思考和實(shí)驗(yàn),在選題工作環(huán)節(jié)中可以利用大數(shù)據(jù)優(yōu)化的方法,并以資料取得成本低廉及分析操作簡易為原則,結(jié)合圖書市場情況做出說明,最終希望可以幫助每位編輯加速選題效率及提升打造暢銷書的概率。
一、嚴(yán)選暢銷書的權(quán)威大數(shù)據(jù)
維克托·邁爾-舍恩伯格和肯尼思·庫克耶(Viktor Mayer-Schnberger & Kenneth Cukier)的著作《大數(shù)據(jù)時(shí)代——生活、工作與思維的大變革》(Big Data:A Revolution That Will Transform How We Live, Work and Think)中,將大數(shù)據(jù)總結(jié)為四個(gè)特征,分別是volume(數(shù)據(jù)體量巨大)、variety(數(shù)據(jù)類型多樣)、velocity(處理速度快)和value(價(jià)值密度低),并指出大數(shù)據(jù)是一種通過對海量數(shù)據(jù)進(jìn)行分析,獲得有巨大價(jià)值的產(chǎn)品、服務(wù)或深刻洞見, 最終形成變革之力。[1]2008年《自然》(Nature)雜志出版的專刊中大數(shù)據(jù)的定義是:數(shù)據(jù)集的規(guī)模是無法在可容忍的時(shí)間內(nèi)用目前的技術(shù)、方法和理論去獲取、管理、處理的數(shù)據(jù)。美國麥肯錫咨詢公司(McKinsey & Company,以下簡稱麥肯錫)在其報(bào)告《大數(shù)據(jù):下一個(gè)創(chuàng)新、競爭和生產(chǎn)力的前沿》(Big data: The next frontier for innovation, competition and productivity)中對大數(shù)據(jù)的定義是:大數(shù)據(jù)指的是大小超出常規(guī)的數(shù)據(jù)庫工具獲取、存儲、管理和分析能力的數(shù)據(jù)集,并指出大數(shù)據(jù)將掀起社會下一輪的變革。[2] 顯然“大數(shù)據(jù)”到底要多大并沒有一個(gè)明確的定義。
現(xiàn)今在大數(shù)據(jù)的時(shí)代背景下研究者可以不再采取傳統(tǒng)的抽樣推論方式對數(shù)據(jù)進(jìn)行分析,而是可以取得全部的數(shù)據(jù)來做分析,并畫出每個(gè)樣本間清晰直觀的關(guān)系圖。目前直接與圖書相關(guān)較為全面且最權(quán)威的數(shù)據(jù),當(dāng)屬北京開卷信息技術(shù)有限公司(以下簡稱開卷)從1998年開始建立的“中文圖書市場零售數(shù)據(jù)連續(xù)跟蹤監(jiān)測系統(tǒng)”所累積的數(shù)據(jù),但多數(shù)數(shù)據(jù)的取得都需要收取費(fèi)用,且該數(shù)據(jù)觀察的對象主要是實(shí)體書店銷售量,面對目前愈來愈多的線上購書行為,網(wǎng)絡(luò)書店的銷售數(shù)據(jù)已經(jīng)成為更重要的數(shù)據(jù)。另一方面,即便出版社有能力付費(fèi)使用該系統(tǒng)的數(shù)據(jù),該系統(tǒng)呈現(xiàn)的數(shù)據(jù)也是幾種固定分析方式出現(xiàn)的結(jié)果,數(shù)據(jù)庫既定的功能選單明顯地限制了編輯使用自己的專業(yè)經(jīng)驗(yàn)與角度去觀察和分析這些珍貴的數(shù)據(jù)。因此編輯有必要找尋更接近市場的大數(shù)據(jù),且培養(yǎng)取回分析數(shù)據(jù)的主動能力。
但現(xiàn)實(shí)并不存在收集到所有讀者消費(fèi)行為數(shù)據(jù)的可能性,因此就只能選擇所在地區(qū)最具代表性、且可取得的數(shù)據(jù)做分析,在國內(nèi)當(dāng)當(dāng)、京東、亞馬遜等主要網(wǎng)絡(luò)書店的銷售數(shù)據(jù),應(yīng)該是目前較具代表性的圖書銷售數(shù)據(jù)。當(dāng)然,也可選擇合并兩家以上數(shù)據(jù)的方法,以求得更全面的資料,但由于每家網(wǎng)絡(luò)書店的數(shù)據(jù)欄目不盡相同,在處理數(shù)據(jù)時(shí)就會比較復(fù)雜,尤其會出現(xiàn)兩平臺數(shù)據(jù)分類標(biāo)準(zhǔn)不同無法合并的問題,因此除非技術(shù)可以克服,一般編輯實(shí)際上可能無法操作。
挖取數(shù)據(jù)的操作方法,首先可通過VBA軟件設(shè)計(jì)程序(也可使用Python數(shù)據(jù)挖掘工具),將網(wǎng)絡(luò)書店上編輯認(rèn)為有需要的所有欄目,如書名、作者、出版日期、定價(jià)、ISBN、暢銷榜排名等數(shù)據(jù),全數(shù)下載成excel文檔,并以人工方式大致瀏覽下載后的數(shù)據(jù)是否正確,為數(shù)據(jù)分析做好準(zhǔn)備。下載數(shù)據(jù)的程序技術(shù)含量并不是太高,若不能通過自學(xué)了解,可請懂計(jì)算機(jī)編程的個(gè)人或?qū)I(yè)公司服務(wù),收費(fèi)視所需下載欄目多寡和對自動化功能要求程度而定。編輯只需把自己需要的資料欄目清楚告訴程序設(shè)計(jì)員即可。本研究下載欄目包含書名、圖書類別、暢銷書排名序號、作者、售價(jià)、出版時(shí)間,下載收費(fèi)約人民幣一千元,即可取得包含上述資料的excel數(shù)據(jù)檔案。這樣的成本不論是公司或編輯個(gè)人都還能負(fù)擔(dān)得起,且可以供多人不斷重復(fù)使用。
二、掌握各類暢銷書基礎(chǔ)概率
從20世紀(jì)40年代就開始發(fā)展的“使用與滿足”理論,把受眾看作是有著特定“需求”的個(gè)人,并把人們的媒介接觸活動看做是基于特定需求動機(jī)來“使用”媒介,從而使這些需求得到“滿足”的過程。1974年卡茲(E.Katz)等人在《個(gè)人對大眾傳播的使用》(Utilization of mass communication by the individual)一文中,更進(jìn)一步將媒介接觸行為概括為一個(gè) “使用與滿足”過程的基本模式,其間受眾被視為一個(gè)有主動選擇信息能力的對象?,F(xiàn)今以市場為導(dǎo)向的圖書選題策劃,正是為了滿足讀者的需求而問世。因此,要提升編輯打造暢銷書的概率,首先得了解目前讀者最喜歡購買的圖書類型,成功的概率才會最大。
從網(wǎng)絡(luò)書店下載的excel數(shù)據(jù)表,就可以輕松做到對每類進(jìn)入暢銷書榜圖書概率的基礎(chǔ)觀察。利用網(wǎng)絡(luò)書店每月暢銷書數(shù)據(jù)表,對“圖書類別”欄做出排序,分別加總每類暢銷書入榜數(shù)量,進(jìn)入暢銷書排行榜總數(shù)量愈多的圖書類別就是最暢銷的圖書類別。但顯然這樣的分類觀察還太粗放,就再用圖書類別的次分類排序,如此就能觀察到更細(xì)化的暢銷書類別市場。舉例而言,經(jīng)濟(jì)情況良好時(shí),財(cái)經(jīng)類圖書幾乎一定能成為暢銷書種,但通過次分類以同樣方式再分析,還能進(jìn)一步發(fā)現(xiàn)財(cái)經(jīng)類圖書又以股票類的財(cái)經(jīng)書最為暢銷。而若要知道自己負(fù)責(zé)的圖書類別在暢銷書榜上的市場占比,則可以用下載的excel文檔中的“出版時(shí)間”先限制觀察時(shí)間段,再以該段時(shí)間內(nèi)全部或選定書種的累計(jì)總數(shù)為分母,欲觀察書種累計(jì)總數(shù)為分子,即可得知。這個(gè)資訊能使編輯了解某特定種類圖書的市場競爭狀況,也就是一定時(shí)間內(nèi)有多少同類書在市場出現(xiàn),和你一起競爭讀者的關(guān)注。
編輯當(dāng)然很想更進(jìn)一步知道暢銷書榜上的個(gè)別圖書到底賣了多少本,但顯然目前并未見有任何網(wǎng)絡(luò)書店會公開每本書的銷售量。要解決這個(gè)問題,編輯只要以自己已出版的圖書銷量為基準(zhǔn),參考暢銷書榜上的圖書排名就能上下推估,大致了解某類圖書登上暢銷書榜的數(shù)量。這無疑是對市場需求量的估計(jì),而圖書首印量的精準(zhǔn)估計(jì)對圖書制作成本的控制顯然有直接幫助。對不同圖書種類基礎(chǔ)概率的了解,無疑能降低編輯選題策劃時(shí)的主觀盲目性,編輯如能做到心中有數(shù),自然從而能提升選題成為暢銷書的概率。[3]
三、暢銷書的形式和主題分析
一旦知道主題類型或次類型暢銷書的上榜概率,任何人都能發(fā)現(xiàn)同類型圖書中總有賣得好,也有賣得差的書,其中圖書內(nèi)容的表現(xiàn)形式會是一個(gè)關(guān)鍵,或者說讀者喜歡一本書的原因,通常并不是因?yàn)轭愋?,而是?nèi)容及表現(xiàn)方式的綜合表現(xiàn)。對暢銷書榜上圖書類型的觀察只會讓編輯了解不同書種進(jìn)入暢銷書榜的基礎(chǔ)概率,但圖書內(nèi)容及表現(xiàn)方式才是一本書可以成為暢銷書的關(guān)鍵因素。早在1956年市場細(xì)分(Market Segmentation)的概念就由美國營銷學(xué)家溫德爾·史密斯(Wended Smith)提出,后由美國營銷學(xué)家菲利浦·科特勒(Philip Kotler)進(jìn)一步發(fā)展和完善成為成熟的STP理論(市場細(xì)分Segmentation、目標(biāo)市場選擇Targeting和市場定位Positioning)。今日圖書市場的經(jīng)營也是遵循相同的營銷戰(zhàn)略,在社會快速發(fā)展的環(huán)境背景下,讀者需求日趨多元與細(xì)化,圖書市場愈來愈重視精耕小眾市場,對數(shù)據(jù)的分析愈精細(xì),對編輯在選題判斷時(shí)的幫助顯然也會愈大。
(一)深挖讀者評論,滿足讀者需求
要細(xì)化市場時(shí),網(wǎng)絡(luò)書店上讀者的評論應(yīng)該是最直接且具有參考價(jià)值的數(shù)據(jù)。當(dāng)當(dāng)和京東網(wǎng)絡(luò)書店對于讀者評論的分類,都有類似的好評、中評、差評、曬圖的等級分類。但這種分類對于編輯探尋暢銷書暢銷的原因幫助并不大。網(wǎng)絡(luò)書店上通常還有另外一種分類,以長踞財(cái)經(jīng)類暢銷書排行榜的《有錢人想的和你不一樣》一書為例,當(dāng)當(dāng)網(wǎng)將該書的讀者書評利用人工智能自動分成“通俗易懂”“觀點(diǎn)獨(dú)特”“實(shí)用”“可操作性強(qiáng)”幾類,這是平臺針對該類圖書讀者購書因素做出的分類,分類后面的數(shù)據(jù)是該類讀者評論數(shù)量的累計(jì)數(shù)據(jù),但目前并不能在點(diǎn)擊分類標(biāo)簽后,帶出該類的所有讀者評論文本。因此,對編輯的選題細(xì)化工作雖稍具啟發(fā),起著大致了解讀者選購該書主要原因的作用,但也僅此而已。利用網(wǎng)絡(luò)書店現(xiàn)成評論分類的好處是省錢、快速,但網(wǎng)絡(luò)書店默認(rèn)的讀者評論分類對編輯在選題策劃時(shí)所需信息,是否適用或夠用會是最大的問題。
如果要更深度地利用這些讀者評論數(shù)據(jù),最好的做法就是利用數(shù)據(jù)挖掘軟件挖出這些評論文本,再自行對下載的文本做出對編輯自己有意義的評價(jià)分類。但觀察大型網(wǎng)絡(luò)書店的圖書評論,如當(dāng)當(dāng)、京東、亞馬遜等網(wǎng)絡(luò)書店讀者的評論,很多編輯可能是要失望的,主要是網(wǎng)絡(luò)書店的讀者評論通常比較簡單。因此,編輯若要分析讀者評論這一部分的資料,建議選取類似豆瓣這樣的讀書社群網(wǎng)站的讀者評論。這類社群的成員因愛書而群聚,通常對圖書有較深刻的評論,因此取出來的評論資料對編輯在選題策劃時(shí)產(chǎn)生的作用也會比較大。以現(xiàn)今讀者為導(dǎo)向的市場規(guī)律,對于讀者評論的觀察與分析,可能會使編輯獲得巨大的收獲,不僅可以更全面地了解讀者需求,還能促發(fā)未來策劃選題的方向。
(二)結(jié)合編輯經(jīng)驗(yàn),多角度分析數(shù)據(jù)
如果編輯確實(shí)沒有能力針對讀書社群網(wǎng)站或文本做更細(xì)致的分析,其實(shí)人工分類也并不是一件如想象中辛苦的事情,因?yàn)橥ǔ充N書都會長期出現(xiàn)在當(dāng)年每月的暢銷書榜上,因此即便是以人工分類,對一位專業(yè)編輯而言,這也絕對是件愈做愈順手的事情。且最重要的是人工分類是編輯切實(shí)親自觀察過該書后,所做出的最適合自己的圖書分類方式。此處以心理勵(lì)志書作為觀察對象說明,本研究以表現(xiàn)形式和主題內(nèi)容兩個(gè)維度來觀察圖書。在表現(xiàn)形式上將暢銷書榜上的心理勵(lì)志類圖書分為散文體、小說體、個(gè)人經(jīng)驗(yàn)分享、提出理論架構(gòu)等,在主題內(nèi)容上分為解決行動力問題、解決負(fù)面情緒、解決特定問題、澄清人生觀等,當(dāng)數(shù)據(jù)分類完成,就可以交叉分析出主題和內(nèi)容搭配的關(guān)系,看看怎樣的表現(xiàn)形式和主題內(nèi)容的搭配最“舉世無雙”。
若編輯還更有心想知道不同表現(xiàn)形式或是主題內(nèi)容在暢銷書榜的銷售力,那就找出每本書在暢銷榜單上的排名,加總排名序號后除以上榜本數(shù)得出平均排名,如此能有更細(xì)致的發(fā)現(xiàn)。舉例而言,兩種不同表現(xiàn)形式和主題內(nèi)容搭配的圖書也許登上每年TOP100暢銷書榜的數(shù)量都是10本,但兩種圖書各自上榜的10本圖書在暢銷書榜上的排名并不會完全相同,算出平均排名后就會發(fā)現(xiàn)有高低的差異,這顯現(xiàn)了不同表現(xiàn)形式和主題內(nèi)容搭配的圖書在暢銷書榜上的銷售貢獻(xiàn)度其實(shí)是有強(qiáng)弱差別的。如有需要編輯還可以嘗試做做統(tǒng)計(jì)分析,如卡方分析、回歸分析等,從而得出暢銷書主題內(nèi)容與形式的搭配模式??傊灰苋〉脭?shù)據(jù),要怎樣分析數(shù)據(jù)并沒有定法,分析的方式正是編輯經(jīng)驗(yàn)的具體化成果。
(三)利用人工智能,提升工作效率
大數(shù)據(jù)的運(yùn)用重點(diǎn)最終是在數(shù)據(jù)長期及大量累積后所展現(xiàn)的意義,借助智能學(xué)習(xí)取代人工分類必然是終極目標(biāo)。目前有不少可以提供類似人工智能服務(wù)的公司,但費(fèi)用并不便宜,實(shí)際向Google Cloud Played詢價(jià)結(jié)果,光是400筆數(shù)據(jù)的智能學(xué)習(xí)費(fèi)用就高達(dá)人民幣16.5萬元上下,而人工學(xué)習(xí)的數(shù)據(jù)自然是愈多愈能達(dá)到正確的結(jié)果,顯然建構(gòu)這樣的智能學(xué)習(xí)功能的成本并不是單一編輯所能承擔(dān)。1937年,英國經(jīng)濟(jì)學(xué)家羅納德·哈里·科斯(R. H. Coase)于《企業(yè)的性質(zhì)》(The Nature of the Firm)中首次提到交易者通常忽略的“交易成本”(Transaction Cost)概念。[4]現(xiàn)實(shí)中,當(dāng)交易成本過高時(shí),尤其是單一的編輯,似乎只能放棄,不可能為了窮盡所有需要的信息,付出過高的交易成本。但對一些有心長遠(yuǎn)發(fā)展的出版企業(yè)而言,這樣的投資卻是有意義的,因?yàn)橹灰腔蹖W(xué)習(xí)成功,以后就能依照編輯的需求對暢銷書排行榜上的圖書做出有針對性的自動分類或文本分析,大大縮短了編輯對暢銷書情況做出基礎(chǔ)分析的時(shí)間。[5]
四、利用文本探勘發(fā)現(xiàn)暢銷書的“小秘密”
編輯如想要分析特定暢銷書的文本或更多社群軟件上讀者的評論或討論內(nèi)容,利用文本探勘工具也是可以做到的。操作方式也是使用現(xiàn)成的數(shù)據(jù)挖掘軟件如Python或委外編寫程序,先取出所有讀者評論的純文字文本文件,如果只是想大致知道讀者評論中最常出現(xiàn)的字詞,可以將取出的某類或某本書的讀者評論直接丟入各種免費(fèi)的文字云線上軟件,從文字云中字詞的大小就能直觀地看出讀者評論關(guān)注的焦點(diǎn),顯然這也應(yīng)該是編輯在選題策劃時(shí)重視的焦點(diǎn)。但如果想要做進(jìn)一步的“定制”分析,就需要利用一些專業(yè)的分析軟件或平臺才能做出更吻合編輯自身經(jīng)驗(yàn)與所需的分析。
編輯要利用許多現(xiàn)成且免費(fèi)的軟件或平臺來分析,首先要做的是將下載的文本文檔格式轉(zhuǎn)換成專業(yè)分析軟件或平臺能接受的檔案格式,才能成功將檔案導(dǎo)入該平臺,利用該平臺上的分析工具來分析。以下舉例說明,上述文字云大小文字的背后其實(shí)是詞頻的展現(xiàn),但現(xiàn)成的軟件編輯并沒有辦法控制斷詞,也沒有辦法了解確切的字頻,或選擇僅以自己在意的關(guān)鍵詞作為觀察或比較對象。此時(shí),可將挖取出的讀者評論文本,上傳至MARKUS [6]或Text annotation for Human [7]等文本標(biāo)記工具平臺 [8],標(biāo)記出自己適用的關(guān)鍵詞,將標(biāo)引后的文本文件存至計(jì)算機(jī),之后將檔案導(dǎo)入Docusky這個(gè)數(shù)位人文學(xué)術(shù)研究平臺 ,就能利用該平臺的分析工具,如:“字頻統(tǒng)計(jì)”“文本風(fēng)格分析”等功能,對最常出現(xiàn)的詞語、不同作者、不同圖書的全文風(fēng)格做出直接比較,或是運(yùn)用“詞夾子”分析工具,對文本做出更深度的語法結(jié)構(gòu)分析,且當(dāng)累積觀察資料的時(shí)間夠久,還能看到受眾偏好的變遷,[9]這些正是大數(shù)據(jù)的魅力所在。導(dǎo)入的數(shù)據(jù)愈齊全,編輯得到的分析就愈接近市場的真相,通過自動化比對或多種分析工具的協(xié)助,極有可能讓編輯發(fā)現(xiàn)更多大眾暢銷書的“小秘密”,這些以大數(shù)據(jù)為基礎(chǔ)分析出的資訊,提供的是一種科學(xué)的鳥瞰圖書市場全貌的視角,這是再勤快的編輯都沒法發(fā)現(xiàn)的事情。大數(shù)據(jù)和自動化為編輯提供了更方便探尋暢銷書秘密的路徑與工具。
沒有人能夠知道確定的未來,但通過數(shù)據(jù)累積和經(jīng)驗(yàn)我們能對未來更有把握,這也是大數(shù)據(jù)利用最大的意義。就像買基金和買股票一樣,每個(gè)銀行的理財(cái)專員或財(cái)經(jīng)專家似乎都能信誓旦旦地告訴你未來的財(cái)經(jīng)趨勢,他們的自信正是來自于背后累積數(shù)十年的龐大數(shù)據(jù)的支持,以及與大環(huán)境參考指標(biāo)對照得出的推測。同樣的,只要數(shù)據(jù)累積夠多、夠完整,通過編輯的專業(yè)分析,編輯也能對暢銷書做出自信而精準(zhǔn)的預(yù)測。此外,用人工智能快速累積的數(shù)據(jù)庫,不僅能提高編輯選題策劃的效率,也同時(shí)起著快速培養(yǎng)出版社內(nèi)部新進(jìn)人員圖書編輯策劃力的作用。
五、善用“熱搜詞”探尋未來暢銷書選題
過去的編輯是庫爾特·盧因(Kurt Lewin)所說的“把關(guān)人”(gatekeeper),只有符合編輯要求,符合出版標(biāo)準(zhǔn)的書籍才能進(jìn)入圖書市場。全媒體時(shí)代是更偏向以受眾需求為導(dǎo)向的時(shí)代,優(yōu)秀的編輯不能僅僅是對圖書內(nèi)容或選題進(jìn)行被動的把關(guān),還要有主動探知市場風(fēng)向、領(lǐng)先捕捉暢銷選題的能力,此時(shí)可能更多要考慮的是社會整體的未來發(fā)展趨勢,而不只是已經(jīng)發(fā)生的圖書銷售數(shù)字信息。好的選題總是能引領(lǐng)市場潮流,而不僅僅是跟隨潮流。如何搶先發(fā)現(xiàn)未來可能受到讀者歡迎的選題,可能是編輯要面對的更重要的問題。這時(shí)編輯的搜尋數(shù)據(jù),就建議從上述與圖書銷售市場相關(guān)的后期指標(biāo),轉(zhuǎn)向網(wǎng)民的“熱搜詞”這類更能反映社會大眾即時(shí)關(guān)注點(diǎn)的前期指標(biāo)做觀察,如此才能更真切地了解未來社會趨勢,搶先一步成功預(yù)測未來暢銷書選題。
(一)通過多種比較,看清未來趨勢
此處以大家都可以免費(fèi)使用的“360趨勢大數(shù)據(jù)分享平臺”(以下簡稱360趨勢)為例,并模擬編輯的選題過程展開論述,說明編輯只要結(jié)合自己的編輯經(jīng)驗(yàn),以自己的觀察角度善用大數(shù)據(jù)平臺所提供的功能,就能對未來暢銷書的選題做出更科學(xué)的預(yù)測。本研究以策劃美食相關(guān)圖書為例,先在360趨勢搜索欄鍵入“美食”這個(gè)關(guān)鍵詞,此時(shí)在“變化趨勢”下方看到“關(guān)注度”及其環(huán)比、同比的上升或下降情況,“關(guān)注趨勢”下還可選擇時(shí)間、地區(qū)了解該關(guān)鍵詞在特定時(shí)間段內(nèi)互聯(lián)網(wǎng)上用戶查詢的平均值狀況,這些意味著該平臺用戶在特定的時(shí)間段、特定的地區(qū)對于此議題的關(guān)注程度。通過多次的比較觀察,可以發(fā)現(xiàn)不同主題在不同時(shí)間段及地區(qū)受歡迎的程度,并藉此來限縮或選擇對自己最為有利的目標(biāo)市場。
除了關(guān)注自己的選題,編輯在執(zhí)行選題工作時(shí)對競爭者的觀察也是重要的功課。此時(shí)編輯可以多增加幾個(gè)假想敵的關(guān)鍵詞,與自己選題的關(guān)鍵詞作比較。以360趨勢為例,該平臺不會向用戶顯示確切的流量數(shù)據(jù),只能看到不同關(guān)鍵詞的流量圖形,但編輯仍可以運(yùn)用該功能做出對暢銷書選題的市場預(yù)測。做法是將一本已經(jīng)出版、自己又知道實(shí)際銷售量圖書的關(guān)鍵詞與新書選題的關(guān)鍵詞同時(shí)做出搜索,就能從兩個(gè)關(guān)鍵詞的比較圖形中清楚看到人們對不同議題的關(guān)注度。若是在“關(guān)注趨勢”搜尋結(jié)果發(fā)現(xiàn),已經(jīng)出版圖書的關(guān)鍵詞搜尋水平遠(yuǎn)高于新選題的關(guān)鍵詞,且已出版的圖書銷售量并不好,新選題的關(guān)鍵詞搜索趨勢又未呈上升趨勢,那很顯然這本新書的選題就不容易成為暢銷書。反之,則機(jī)會明顯大得多。
(二)通過強(qiáng)弱關(guān)系,推敲選題方向
了解趨勢固然重要,但做選題策劃時(shí)編輯還需要細(xì)化選題,如要進(jìn)一步了解關(guān)注“美食”這個(gè)議題時(shí),人們都在談?wù)撃膫€(gè)面向的話題,這時(shí)觀察“需求分布”下方的“關(guān)注美食都關(guān)注”,該欄目通過對平臺內(nèi)的大數(shù)據(jù)分析,清楚呈現(xiàn)出用戶搜索的不同關(guān)鍵詞與“美食”此一關(guān)鍵詞間關(guān)系的強(qiáng)弱。關(guān)鍵詞關(guān)系圖為編輯提供了在策劃“美食”相關(guān)書籍時(shí),再細(xì)化選題時(shí)的方向指引,與“美食”關(guān)系較強(qiáng)的關(guān)鍵詞,也就是關(guān)注美食的人談到美食時(shí)最常談到的話題,如看到關(guān)系較強(qiáng)的“供貨商”“運(yùn)動”“菜譜”等關(guān)鍵詞,編輯就可以合理判斷食品安全、減肥餐、各類菜譜等選題的圖書成為暢銷書的概率可能會更高。目前360趨勢的每個(gè)詞語都鏈接了360搜索,編輯點(diǎn)擊任一關(guān)鍵詞就會直接跳轉(zhuǎn)到360搜索頁面,帶出全網(wǎng)海量的搜索及社交媒體數(shù)據(jù),非常方便編輯對感興趣的數(shù)據(jù)做更進(jìn)一步的了解與分析。搜尋結(jié)果同時(shí)還會出現(xiàn)“美食的相關(guān)排行”和“相關(guān)搜索詞”兩種排序?!跋嚓P(guān)搜索詞”下的“搜索飆升詞”會顯示上升最快的相關(guān)搜索詞,可了解重點(diǎn)關(guān)鍵詞的近期搜尋熱度。在“搜索飆升詞”欄排序在前的主題就比較有成為暢銷書的可能,如果已到下坡段則應(yīng)該考慮放棄這個(gè)方向的主題,向其他方向去策劃美食圖書。
在大數(shù)據(jù)時(shí)代背景下,類似這種能做出趨勢觀察的平臺并不少見,如谷歌趨勢、百度指數(shù)及新浪微指數(shù)等。這些免費(fèi)大數(shù)據(jù)平臺上獲取的數(shù)據(jù)和圖書選題策劃看似并沒有直接的關(guān)系,且極有可能使用者搜尋熱度高的議題,并不能完全直接轉(zhuǎn)化為使用者對該類選題圖書的購買行為。但相較于以往編輯在選題策劃時(shí)搜集的靜態(tài)資料或圖書銷售數(shù)據(jù)等市場后期指標(biāo),這些通過互聯(lián)網(wǎng)用戶“熱搜詞”累積的大數(shù)據(jù),在一定程度上更能協(xié)助編輯對外部環(huán)境的大趨勢做出更即時(shí)、更有效率、更科學(xué)的觀察。編輯如能通過自己的編輯經(jīng)驗(yàn),并熟悉平臺上各種功能的操作,通過設(shè)置適當(dāng)關(guān)鍵詞搜尋,以及利用對時(shí)間、地域等的限縮、比較或篩選等功能的操作,當(dāng)能增強(qiáng)選題工作的效率,并得出對選題策劃工作有重要參考價(jià)值的信息。
六、讀者用戶面貌大數(shù)據(jù)的缺失與局限
前述開卷“中文圖書市場零售數(shù)據(jù)連續(xù)跟蹤監(jiān)測系統(tǒng)”所累積的數(shù)據(jù),雖為目前國內(nèi)最為權(quán)威的圖書數(shù)據(jù),但該數(shù)據(jù)來源主要為全國2000多家實(shí)體書店數(shù)據(jù),近年雖已納入20多家網(wǎng)上書店數(shù)據(jù),但對幾個(gè)重要網(wǎng)絡(luò)書店當(dāng)當(dāng)、亞馬遜等的數(shù)據(jù)仍并未納入,在讀者日益仰仗線上渠道完成購書行為的數(shù)字時(shí)代,線上圖書銷售數(shù)據(jù)的缺失,無疑將使得該數(shù)據(jù)對圖書市場零售數(shù)據(jù)的代表性有所消減,且開卷握有的只是圖書本身的產(chǎn)品資訊和市場訊息,對于用戶的面貌并無法得知。1941年B.R.貝雷爾森(B. R. Berelson)等在《讀書為我們帶來什么》(What reading does to people)一文中,就將性別、年齡、學(xué)歷、職業(yè)等因素作為控制變量,嘗試發(fā)現(xiàn)不同特性的讀者使用與滿足行為的差異性。面對今日細(xì)分化的圖書市場,除了對圖書已有銷售數(shù)據(jù)的分析,編輯顯然必須更清楚自己所面對的目標(biāo)讀者面貌,才能為讀者量身訂做,打造出成功的暢銷書。
(一)用戶資料與取得交易成本的抉擇
目前能取得讀者用戶數(shù)據(jù)的就是各種線上圖書銷售平臺,如當(dāng)當(dāng)、京東、亞馬遜等網(wǎng)絡(luò)書店,因?yàn)樗械乃阉饔涗?、消費(fèi)行為和個(gè)人注冊信息,都會被完整地保存在網(wǎng)絡(luò)書店的后臺,但目前這些網(wǎng)絡(luò)書店都未開放這些數(shù)據(jù)供一般大眾閱覽,[10]主要原因是網(wǎng)絡(luò)書店扮演的其實(shí)是線上圖書經(jīng)銷商的角色,重點(diǎn)是從圖書銷售行為中獲取銷售傭金,用戶信息某種程度上正是這些網(wǎng)絡(luò)書店賴以為生的秘密,當(dāng)簡單的銷售排名已經(jīng)能夠滿足讀者選購圖書時(shí)的資訊需求,平臺就沒有增設(shè)更多數(shù)據(jù)分析功能的必要性。另一方面,此類無法通過查詢在網(wǎng)絡(luò)上出現(xiàn)的數(shù)據(jù),多半涉及用戶隱私安全問題,因此該平臺也會提升對自家服務(wù)器的保護(hù),以致無法簡單地通過一般的數(shù)據(jù)采擷軟體或計(jì)算機(jī)編程而取得,而如果要用更專業(yè)的方式取得,勢必得花費(fèi)較高昂的代價(jià)。想要愈精細(xì)的資料與分析就需要負(fù)擔(dān)更高的成本,但當(dāng)費(fèi)用過高時(shí),前述“交易成本”又是一個(gè)必要的考慮因素,另一方面也會涉及合法性的問題。
但即使客戶數(shù)據(jù)并不容易取得,網(wǎng)上也仍有些平臺有免費(fèi)的用戶信息揭示,如在360趨勢點(diǎn)擊平臺的“用戶畫像”即能自動帶出該平臺使用者的年齡、性別資料,各大網(wǎng)絡(luò)書店年終發(fā)布的報(bào)告對平臺的用戶面貌也會有些基本分析,除此之外如果要了解藏在平臺后面更多的用戶數(shù)據(jù),多半就要付費(fèi)使用。因此,對于此部分?jǐn)?shù)據(jù)的運(yùn)用,目前只見部分網(wǎng)絡(luò)書店與特定出版社以個(gè)案方式合作開展。
(二)了解用戶特性,修正分析結(jié)果
實(shí)際生活中并沒有“完美的大數(shù)據(jù)”,平臺的特性決定了該平臺數(shù)據(jù)的開放程度與內(nèi)容,淘寶指數(shù)的“生意參謀”是為了服務(wù)淘寶平臺上廣大的電商;百度指數(shù)、新浪微指數(shù)、微信指數(shù)則多半是基于引導(dǎo)客戶投放廣告的立場才揭露該平臺的用戶搜索數(shù)據(jù),西瓜數(shù)據(jù)揭露的微信大V排行也是如此,這是利用大數(shù)據(jù)時(shí)必然的局限。[11]另一方面,每個(gè)平臺能給出的大數(shù)據(jù)也都只能是該平臺自身用戶數(shù)據(jù)的累積,而平臺特性也決定了平臺的用戶特征。因此,編輯在選擇使用免費(fèi)大數(shù)據(jù)平臺時(shí),對于平臺的屬性必須要先有了解,才能在利用的時(shí)候?qū)Ψ治龅慕Y(jié)果有所修正。用戶數(shù)據(jù)的缺失,可能會導(dǎo)致編輯在解讀大數(shù)據(jù)時(shí)的嚴(yán)重偏差,以致造成對市場的誤判。這可能是編輯利用免費(fèi)大數(shù)據(jù)或用編寫程序挖掘出的數(shù)據(jù)時(shí)最無法掌握的部分,但卻可能是最重要的部分。
七、編輯必須掌握數(shù)據(jù)分析能力
面對現(xiàn)階段完整大數(shù)據(jù)取得的困難,有些學(xué)者并不贊成單一出版社僅用自己手邊的“小數(shù)據(jù)”分析,而應(yīng)和握有UGC(User Generated Content)數(shù)據(jù)的電商、社交平臺等合作,或向微軟、谷歌等大數(shù)據(jù)服務(wù)廠商直接購買所需的數(shù)據(jù)[12]。但筆者認(rèn)為如果數(shù)據(jù)并不全面,編輯只是以單一出版社窗口接觸到的讀者資料作為基礎(chǔ)數(shù)據(jù)來分析,分析的結(jié)果當(dāng)然會有偏頗,但出版社與網(wǎng)絡(luò)書店平臺的合作畢竟只是個(gè)案,編輯的工作卻是常態(tài),倚靠他方提供分析后的數(shù)據(jù)作為選題依據(jù)的做法,其實(shí)編輯并沒有真正做好選題的工作,充其量只是追隨市場,卻很難領(lǐng)先市場,加上多數(shù)出版社的預(yù)算可能不足以長期支付數(shù)據(jù)取得和分析的費(fèi)用,個(gè)案式的合作方式并不能全面提升編輯的選題能力。只要數(shù)據(jù)不掌握在自己的手中,大數(shù)據(jù)對大多數(shù)的編輯而言將永遠(yuǎn)是看得到吃不到的“高科技”。[13]
本研究經(jīng)過實(shí)際操作,證實(shí)今日編輯其實(shí)已經(jīng)可以通過現(xiàn)有的數(shù)據(jù)挖掘軟件開發(fā)簡易小程序,或以個(gè)人承擔(dān)得起的費(fèi)用委托定制可永續(xù)隨時(shí)使用的數(shù)據(jù)挖掘程序,從網(wǎng)絡(luò)上免費(fèi)挖取到選題時(shí)需要的珍貴數(shù)據(jù)。這些散布在各處的公開信息原本就是過去編輯收集選題的重要資料來源,只是在大數(shù)據(jù)時(shí)代,通過自動化和對數(shù)據(jù)不同角度的分析,編輯還能進(jìn)一步看到單一或少量資料所不能呈現(xiàn)的暢銷書背后的秘密。
對于一個(gè)身處大數(shù)據(jù)時(shí)代的編輯,掌握分析數(shù)據(jù)的能力是必要的,先不論編程或其他能力,僅僅是對excel函數(shù)設(shè)置能運(yùn)用自如,都能大大提升工作效率。當(dāng)編輯可以親自去操作分析手邊的大數(shù)據(jù)時(shí),這將不只是工作方式的改變,背后代表的更是數(shù)字時(shí)代編輯在選題策劃時(shí)思維方式和策略的轉(zhuǎn)向。大數(shù)據(jù)給了編輯一個(gè)像飛鳥般鳥瞰市場全貌的機(jī)會,讓編輯能“見樹又見林”,但編輯必須要把分析數(shù)據(jù)的能力拿回來,[14]因?yàn)榉治鰯?shù)據(jù)的方式蘊(yùn)含著編輯工作經(jīng)驗(yàn)的體現(xiàn),其中包括很多不同分析角度的可能嘗試,這并不是對所有數(shù)據(jù)都用幾種固定方式分析就能處理的問題,如果編輯不能把數(shù)據(jù)時(shí)時(shí)掌握在自己的手上,時(shí)時(shí)思考嘗試不同的分析角度,那即使大數(shù)據(jù)為我們插上了“飛天的翅膀”,編輯依舊很難發(fā)現(xiàn)深藏在數(shù)據(jù)海背后深層的價(jià)值與局限,而這也正是編輯經(jīng)驗(yàn)的價(jià)值所在。
八、結(jié)語
數(shù)字時(shí)代出版社轉(zhuǎn)型升級已開展數(shù)年,從設(shè)計(jì)排版、印刷,到經(jīng)營管理,今日出版社的作業(yè)方式相較于以往已經(jīng)產(chǎn)生巨大的變革,但位居圖書出版最前端的選題工作,似乎永遠(yuǎn)是資深編輯心中難以“丈量”的秘密。資深編輯經(jīng)年累月的工作經(jīng)驗(yàn)確實(shí)有無可取代的珍貴價(jià)值,本文所提供的選題技術(shù)操作方法,也或許不是編輯在執(zhí)行選題工作時(shí)必要的方法,但身處科技迅速發(fā)展的時(shí)代,通過現(xiàn)成的在線平臺服務(wù)和簡單的程序設(shè)計(jì)對數(shù)據(jù)進(jìn)行挖掘,卻可以讓編輯的選題工作變得更科學(xué),而不僅僅只是依靠“靈感”或經(jīng)驗(yàn)。建立善用大數(shù)據(jù)分析和觀察書市的習(xí)慣,能更科學(xué)地增強(qiáng)編輯打造暢銷書的效率和概率,長期數(shù)據(jù)的累積對出版社新進(jìn)人員選題策劃能力的快速養(yǎng)成也起著巨大的功用。誠如麥肯錫的報(bào)告所言,數(shù)據(jù)作為重要的生產(chǎn)因素已經(jīng)滲透到當(dāng)今的每一個(gè)行業(yè),對海量數(shù)據(jù)的挖掘效率和運(yùn)用效率將直接影響著新一輪生產(chǎn)力的增長。[15]在數(shù)字時(shí)代編輯選題策劃的工作方式,也應(yīng)該跟上時(shí)代,善用大數(shù)據(jù)更高程度地滿足讀者真實(shí)的需求。
(作者單位:閩南師范大學(xué)新聞傳播學(xué)院)

*?本文系2018年度國家社會科學(xué)基金一般項(xiàng)目(項(xiàng)目編號:18BXW041);福建省教育科學(xué)“十三五”規(guī)劃2018年度課題(項(xiàng)目編號:FJJKCG18-024)基金支持。

[1]維克托·邁爾-舍恩伯格,肯尼斯·庫克耶. 大數(shù)據(jù)時(shí)代——生活、工作與思維的大變革[M].周濤,譯. 杭州:浙江人民出版社,2013.

[2]Mc Kinsey Digital,Big data:The next frontier for innovation,competition, and productivity [EB/OL].(2011-05-01)[2019-12-22]. https://www.mckinsey.com/ business-functions/mckinsey-digital/our-insights/big-data-the-next-frontier-for-innovation.

[3]王琪.大數(shù)據(jù)時(shí)代圖書選題策劃的技術(shù)手段[J].編輯學(xué)刊,2013(5):78-79.

[4]R.H.Coase.The Nature of the Firm[J/OL].Economics New Series,1937,4(16):386-405.https://www.jstor.org/stable/2626876.

[5]張博,雷錦,樓文高.新聞出版領(lǐng)域大數(shù)據(jù)應(yīng)用模式研究[J].出版發(fā)行研究,2017(12):31-34.

[6]MARKUS是專為中文文本所設(shè)計(jì)的半自動標(biāo)記工具,碼庫思(MARKUS):古籍半自動標(biāo)記平臺,http://dh.chinese-empires.eu/beta/.

[7]Text annotation for Human,https://doccano.herokuapp.com/.

[8]Docusky數(shù)位人文學(xué)術(shù)研究平臺,https://docusky.org.tw/DocuSky/ds-01.home.html.

[9]周嵐,吳霄征.大數(shù)據(jù)在圖書選題策劃中的應(yīng)用[J].中國管理信息化,2017,20(19):72-74.

[10]劉志偉.2014出版商電商深度合作期待幾何?[N].中國出版?zhèn)髅缴虉?bào),2014-02-08.

[11]石姝莉,朱姍姍.基于“大數(shù)據(jù)”的暢銷書策劃與運(yùn)作[J].中國出版,2016(9):37-41.

[12]閆偉華.大數(shù)據(jù)分析與暢銷書選題的精準(zhǔn)策劃[J].編輯之友,2015(6):5-9.

[13]范春龍.淺析大數(shù)據(jù)在圖書出版中的運(yùn)用[J].中國傳媒科技,2018(8):115-116.

[14]周永斌.淺析大數(shù)據(jù)時(shí)代研究型策劃編輯的六項(xiàng)選題信息能力建設(shè)[J].科技與出版,2016(2):46-49.

[15]McKinsey Digital,Big data:The next frontier for innovation,competition,and productivity [EB/OL].(2011-05-01)[2019-12-22]. https://www.mckinsey.com/ business-functions/mckinsey-digital/our-insights/big-data-the-next-frontier-for-innovation.

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
抖音,看不見讀書人的美
編輯做市場調(diào)研的16種方法
“互聯(lián)網(wǎng) 出版”對編輯的素質(zhì)要求
偽書為何暢銷?聽我說說貓膩——書明明不怎么樣,但是高居各媒體的推薦榜單,為什么?
暢銷書是怎樣策劃出版的
影響圖書編輯收入的25本專業(yè)書
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服