B站為什麼一直在稽覈(b站稽覈需要多久)
本文作者:亨哼(作者公眾號:亨哼陣地),題圖來自:IC photo
3月18日,B站公佈了截至2019年12月31日的第四季度和全年未經審計的財務報告。2019財年總營收達67.8億元人民幣,同比增長64%,其中第四季度營收同比增長74%,達20.1億元人民幣,連續七個季度超市場預期。
與喜人的財報一同到來的,還有B站UP主們越來越多的抱怨,UP主們一方面欣喜於“小破站”規模越來越大,另一方面也越來越對B站孱弱的變現能力、混亂的MCN生態和越來越長的稿件稽覈時間、越來越嚴苛的內容稽覈標準表示不滿,尤其進入3月以來,B站UP主投遞一篇稿件,稽覈時間少則五六小時,多則竟然超過24小時,很多稿件錯過了最佳的釋出時間。
我前不久投遞的一個稿件,稽覈了超過20小時,作為一名產品經理,我認為有必要從產品和商業角度,找一找B站稽覈變慢的原因,同時也可以試著分析一下內容社羣產品在內容風控策略上的一些要點。
一、B站稽覈為什麼這麼慢?
一個內容社羣的使用者角色,大致可分為內容生產者(創作型使用者)和內容消費者(瀏覽型使用者),既有內容的生產創作,又有觀眾能夠消化掉創作產能,形成良好的社羣內容生態。
對於B站來說,UP主們為愛發電是B站快速增長的重要基礎,也是B站拿下國內最大視訊UGC社羣地位的重要基石。如何服務好這一波內容生產者,是B站一個很關鍵的命題。B站的社羣氛圍和觀眾品味,都導致了社羣使用者對於作品的要求極為苛刻,UP主們費盡心機,要討好“觀眾老爺”,那UP主受的委屈,當然要在小破站上找回來,平臺要是伺候不好UP主,那UP主就要炸毛了。
因此,3月以來,稽覈時間大幅變長,引發了UP主大面積的抱怨,很多追熱點的稿件,等稽覈釋出出來,熱點都過去了。近日B站稽覈為什麼這麼慢?其實正如近幾日美股屢次熔斷一樣,B站稽覈變慢也是多重原因共同作用的結果。
1. 稿件量激增,創作者作品成倍增長
從2019年開始,B站“破圈”的跡象就越來越明顯,如今,B站已經從一個小眾的亞文化社羣,變成多元的大眾化平臺,隨便一個使用者,都能明顯地感受到,來B站做UP主的人變多了。
資料也支撐了這一點。根據B站2019年第四季度財報,B 站月均活躍UP主數量突破100萬,同比增長80%;其月均投稿量同比增長66%達280萬。與數量增長相輔相成的,還有稿件型別的多樣化,例如在這段時間入駐並快速大火的“巫師財經”“半佛仙人”、入駐但沒火的“宇宙維修隊亨哼”等UP主,都在印證著B站內容創作在各個領域的破圈。
在進入2020年以來,受疫情隔離影響,B站使用者數再次大規模激增,同時受到實體經濟不景氣影響,開始兼職UP主的專業人士也相應增多。我根據av號(B站視訊唯一編碼)做了一個保守的大致估算,2018年12月,B站日稽覈視訊量大約為6萬個,而今年3月,達到了13萬個。
如此快的稿件增長,B站的稽覈系統很難快速響應擴容,原有的稽覈資源再繼續啃翻倍的工作量,自然壓力很大。同時還有一點,大量作品新增,原有的伺服器資源也壓力倍增,視訊轉碼和壓制時間也相應變長,這可以從視訊投稿後的轉碼時間看出。
2. 受疫情影響,B站稽覈力量難以全量支援
疫情隔離對於使用者來說,是空閒在家有時間創作更多的視訊,但對於平臺來說,意味著大量員工難以正常返崗。
2018年7月,B站在國家多部門約談並要求後整改後,投入運營了位於武漢的新稽覈中心,擴增一倍以上稽覈人力。之後,B站大量的稿件稽覈都由武漢稽覈中心完成稽覈,此次受疫情影響,其他城市陸續返工,但武漢恢復正常工作秩序尚需時日。
上海總部的稽覈力量本身不足,而且內容稽覈這個工作的離職率相當高,年前離職的空缺,年後因為疫情,一時也不能快速補充新的人進來。
一面是入水口變粗,一面是出水口變窄,自然泡在稽覈池子裡的稿件就越積越多。
3. 新規定帶來新的稽覈標準
去年12月,國家網信辦針對網際網路內容亂象,出臺了《網路資訊內容生態治理規定》,明確了網路資訊內容服務平臺的責任,從2020年3月起正式開始實行。
在剛剛開始正式施行的這一關頭,誰都不敢鬆懈,B站也相應地調整了稽覈尺度的把關,同時,由於新規定需要更多的培訓向基層稽覈人員普及,也需要時間適應。
4. B站的內容風控稽覈機制
相較於其他平臺,B站的稽覈屬於比較慢的那一種。這當然是由於國情使然,不過也反映出了平臺稽覈機制的效率問題。如何利用機器稽覈和人工相配合,如何權衡效率和成本,是B站亟需想明白的問題。
插一句,不存在思考“效率和標準鬆緊”的問題,內容風控不容半點馬虎,必須以最嚴苛標準為準繩,一條違規資訊,都可能導致整個平臺萬劫不復。
二、內容風控策略的核心要點是什麼?
對於一款產品來說,其基本業務框架的抽象模型可以總結為“業務”、輔助業務的“增長”、保障業務的“風控”和支撐以上三點的“資料”。
“業務”自然是產品最關鍵的地方,“增長”“風控”和“資料”都是輔助業務良態執行。對B站的內容業務來說,協調內容生產者和內容消費者,形成良好的內容生態是關鍵的核心,輔以使用者增長(包括使用者增長和創作者增長兩個方面),並且對社羣進行風控。
通過業務的發展和增長、風控的積累,形成使用者基礎資料、註冊資訊、瀏覽行為、視覺偏好、使用者標籤等資料,然後通過這些資料,再反向支撐業務發展,形成產品內的資料打通。
本文所要著重分析的,就是風控這一環節。 金融產品、信貸產品有風控非常好理解,但其實,所有型別的產品都需要有風控。電商產品要防薅羊毛,社交產品要防欺詐,而內容產品,則是要對平臺內容的質量和合規性進行風險控制。
對於內容社羣等UGC產品來說,風控線就是生死線。內容和社羣產品的風控壓力來源於監管側,風控物件是使用者在平臺釋出的內容。
1. 內容風控要“控”什麼?
來自內容側的風險主要有三類。
其一是政策層面的內容合規,要符合監管的要求。監管要求的內容可參考最新實行的《網路資訊內容生態治理規定》,對於各項違規內容都做了詳細規定,大致概括可分為涉政、違禁、暴恐、色情等四類,這部分是政策紅線,一旦觸及,輕則約談,重則下架、封禁。
其二是社羣氛圍的良性導向,如謾罵、隱私等。這一型別的內容雖然不會觸及監管紅線,但倘若內容社羣充斥各種負能量,對於社羣氛圍是非常嚴重的損害,傷及使用者體驗,導致使用者流失,影響產品商業利益。這一型別內容風控還包括對於產品運營主體的保護,例如對吐槽公司工作人員的內容進行限流處理、對平臺和產品的詛咒進行刪除等,屬於商譽和公關層面的維護,同時也是對產品官方公信力的維護。
其三是社羣使用者安全的保證。對於內容和社羣產品而言,平臺內一定會存在導流、灰產、詐騙等不法手段,如何保護平臺內使用者的財產安全和產品體驗,是非常關鍵的,網際網路發展至今,導流、詐騙等行為往往是成熟的灰黑產產業鏈所為,他們擁有豐富的反監查和防過濾經驗,揪出他們並進行處理,需要平臺與其鬥智鬥勇。
2. 內容風控的方法和手段
在最早期的階段,對內容進行風險控制,只能通過編輯人工進行稽覈。這種方式需要大量的人力物力,而且稿件稽覈需要時間長,時效性也被大大削弱。一般的公司,很難負擔起龐大的內容稽覈團隊。
之後,誕生了關鍵詞過濾等手段,成為成本較低,並且使用最為廣泛的內容風控措施。對於命中預設的違禁關鍵詞的內容,直接阻止發出或者轉交人工稽覈。這種方式價效比極高,耗費成本小,但基本可以過濾掉大多數的違規內容。
關鍵詞過濾存在的問題也很明顯,準確率較低,經常出現誤傷和漏網的情況,對於內容和社羣平臺來說,這是不能容忍的,前文已經講過,哪怕一篇違規內容被放出來,產品都有可能被封禁。再加上網路的普及,越來越多的人學會了通過拼音、亂碼、諧音等方式繞開關鍵詞,關鍵詞過濾逐漸不再能勝任內容風控的工作任務。
以上基本還屬於規則的範疇,之後內容風控的發展,就進入了AI 策略的時代。
AI方面,其實叫機器學習更加準確,這是一套組合拳。舉個例子,對於一個視訊稿件的稽覈,就需要對整個視訊進行逐一拆幀,然後通過OCR文字識別檢查字幕,此時對於字幕的檢查和文字內容的檢查基本一致,文字識別涉及到NLP分詞、語義理解等AI技術;對於畫面,則是圖片識別,識別圖片中可能出現的違禁內容,這裡涉及到一個準確率的問題,暴恐視訊不能夠通過,但遊戲視訊也存在戰鬥畫面,如何保證不誤傷;對於音訊,則需要兩個方面的審查,一方面是視訊當中的語句,將語音轉文字,再通過文字的稽覈策略來稽覈,另一方面是音調識別,例如識別音訊當中的嬌喘等無語句的聲音。
機器學習還是就稿件論稿件,而一個優秀的內容風控平臺,是需要配合策略的。策略產品經理是近幾年一個特別火的崗位,提供更精細化的、動態的、效率的產品解決方案。對於策略來說,內容的風控不能只在單個內容上,還需要結合更高的維度,給與更加精細化的識別判斷。策略要從單個內容出發,延伸到釋出該內容的使用者基礎資訊、關係鏈、過往內容、實名可信度等等諸多維度進行調參和計算,以判斷這名使用者的這條內容是否需要更細緻的識別。
這裡要特別強調一點,即使平臺的機器演算法再先進,所有的內容還都需要過人稽覈。所有內容過人,所有內容過人,所有內容過人,重要的事情說三遍,至於原因,還是上面那一條,內容和社羣平臺不容有半點閃失。
不過機器平臺越先進,能夠為人工稽覈提供的輔助也就越全面準確,人工稽覈的效率自然也就變高,稽覈人員的壓力也相應減弱。
另外,對於內容風控,又會有前置風控(先審後發)和後置風控(先發後審)等不同的方式,關於這一點,以後有機會再詳細分析優劣和適用場景。
對於B站來說,隨著內容量越來越大,單純的對稽覈人工進行擴容,恐難以解決問題。相比抖音、今日頭條、西瓜視訊等頭條系產品、背靠百度AI的愛奇藝、騰訊視訊、阿里大文娛旗下的優酷視訊,B站崛起晚、資源少、技術儲備弱,在機器輔助稽覈上還比較弱勢,今後加強內容風控技術,優化內容稽覈策略,改善稽覈後臺的體驗,不失為一個好方法,畢竟工欲善其事,必先利其器。
本文作者:亨哼,作者公眾號:亨哼陣地(ID:hengpaper)