服務(wù)熱線
15617359779
15617359779
“如果說互聯(lián)網(wǎng)是優(yōu)化信息的存儲和傳輸方式,提升生產(chǎn)要素之間的運行效率;人工智能便是對各個生產(chǎn)要素的升級?!?/p>
本人初入職場便從事TOB相關(guān)工作,參與了tbds等大數(shù)據(jù)平臺的產(chǎn)品建設(shè),近兩年逐漸接觸人工智能;目前主要負(fù)責(zé)TI-ONE機器學(xué)習(xí)平臺,結(jié)合自己工作經(jīng)驗,在這里分享一些關(guān)于ML產(chǎn)品的思考和實踐。
人工智能產(chǎn)品類型
平臺-強調(diào)賦能
基礎(chǔ)支撐/基礎(chǔ)平臺-通用的ML技術(shù)平臺,實現(xiàn)常用的算法,形成通用機器學(xué)習(xí)平臺(Spark/TensorFlow等),對外提供API、SDK等,為業(yè)務(wù)賦能。這類平臺聚焦性能、開發(fā)效率和預(yù)測準(zhǔn)確度。
應(yīng)用-融入場景
突出場景閉環(huán),如利用人臉識別、自然語言處理(NLP)等技術(shù)構(gòu)建新的交互體驗和用戶場景。
目前市面上看到的人工智能產(chǎn)品都屬于弱人工智能的范疇,它們通常專注于某一特定領(lǐng)域,有一定規(guī)則邊界,是達(dá)成既定目標(biāo)的工具;各個領(lǐng)域的初級崗位最有可能被這類人工智能替代。
人工智能產(chǎn)品流程
數(shù)據(jù)
讓人工智能產(chǎn)品能夠運轉(zhuǎn)起來的前提,首先需要尋找和積累大數(shù)據(jù),大數(shù)據(jù)是機器學(xué)習(xí)平臺必需的燃料,有足夠大的燃料,平臺所跑出的模型精確率會越高。
通常我們會通過中間件工具(KAFKA/tube)進行流轉(zhuǎn),將數(shù)據(jù)運輸?shù)紿DFS等存儲平臺,包括文本、圖片、語音等數(shù)據(jù),并對其做數(shù)據(jù)清洗,特征處理等,便于加載到接下來的神經(jīng)網(wǎng)絡(luò)。
算法、訓(xùn)練模型
訓(xùn)練出一個有效的模型的前提,需要數(shù)據(jù)和算法兩者的雙管齊下;從計算模型的角度,我們通過所獲取并清洗好的一組數(shù)據(jù),配置好算法相關(guān)的關(guān)鍵參數(shù)來構(gòu)建模型的運行,從而形成了一定的反饋路徑,來達(dá)到預(yù)期的輸出結(jié)果。
通過數(shù)據(jù)的灌輸,建立起輸入-處理-輸出(IPO)的關(guān)系,加載到神經(jīng)網(wǎng)絡(luò)的訓(xùn)練中,學(xué)習(xí)數(shù)據(jù)中的規(guī)律并產(chǎn)生一個最能契合這些數(shù)據(jù)的函數(shù)表達(dá)式。在訓(xùn)練過程中,不斷去試錯和糾正,去推進模型更為精準(zhǔn)的路上。對模型準(zhǔn)確度有足夠信心,便可把訓(xùn)練完成后的模型部署上去,去預(yù)測喂養(yǎng)新數(shù)據(jù)后的結(jié)果是什么。例輸入的是人臉圖片,那么輸出結(jié)果便是人臉識別結(jié)果。
應(yīng)用模型
當(dāng)模型精確度足夠高后,便可上線服務(wù),實際運用到我們的系統(tǒng)中。典型的例子是電商系統(tǒng)中基于用戶/物品的推薦。
人工智能產(chǎn)品經(jīng)理的思考點
1.明確產(chǎn)品的定位,找到產(chǎn)品能發(fā)揮價值的地方
在做TI-ONE初期,我們的目標(biāo)是做一個通用/易用性高的機器學(xué)習(xí)平臺,讓方便業(yè)務(wù)接入平臺。用戶無需關(guān)注機器學(xué)習(xí)的運行細(xì)節(jié),如底層用什么計算框架、用多少計算資源、應(yīng)該怎樣配置參數(shù)等,將注意力重點放在核心業(yè)務(wù),同時也可以享受機器學(xué)習(xí)帶來的便利。
我們把TI-ONE設(shè)定為一個拖拽式建模工具而不是類似于jupyter的交互式工具,雖然jupyter有很好的拓展性,但為了降低機器學(xué)習(xí)使用門檻和釋放用戶大量寫代碼的時間和精力,增加受眾面,我們選擇了把特征處理、算法以模塊化的方式來設(shè)計,讓用戶在拖拽組件中,快速完成模型的搭建。
在產(chǎn)品化機器學(xué)習(xí)的時候,發(fā)現(xiàn)大部分工作不是在研究復(fù)雜的公式理論,而是如何讓用戶在使用機器學(xué)習(xí)的過程中更順暢,讓不同步驟之間的流程如數(shù)據(jù)的準(zhǔn)備、算法參數(shù)的填寫、模型的訓(xùn)練/測試/篩選/部署等,能夠無縫銜接。舉個例子,規(guī)劃及組織平臺所需要的數(shù)據(jù)、用什么方式和工具來統(tǒng)一數(shù)據(jù)的上傳、對數(shù)據(jù)的接入是否需要提供預(yù)覽;如何幫助用戶獲得高質(zhì)量的數(shù)據(jù)集,為提煉優(yōu)質(zhì)模型提供保障、如何高效率低成本地為數(shù)據(jù)打標(biāo)簽、把數(shù)據(jù)價值最大化,這些都是產(chǎn)品經(jīng)理需要重點耗費精力的地方。
在此引用谷歌大腦高級科學(xué)家Martin Zinkevich的一句話“To make great products:do machine learninglike the great engineer you are, not like the great machine learning expert youaren’t”把工程效率提升到極致了,用戶才能真正享受到算法帶來的便利。
2.產(chǎn)品形態(tài)的把握
對于人工智能產(chǎn)品經(jīng)理,所需的技能SET,不僅包括原型能力、功能邏輯、信息路徑、UI設(shè)計,算法模型、數(shù)據(jù)訓(xùn)練等產(chǎn)品背后抽象的邏輯也同樣重要。
比如立項一個人工智能產(chǎn)品,我們不能很寬泛地定位要做一個機器寫作,這個需求的范圍太大,會讓后續(xù)功能的開發(fā)不好收斂。產(chǎn)品經(jīng)理需要盡量參與到算法開發(fā),了解算法的每個步驟,對涉及的環(huán)節(jié)有個清晰的概念,并在此基礎(chǔ)上尋找和評估是否有產(chǎn)品化的可能性。
再比如我們要做新聞主題分類,首先需要利用網(wǎng)頁抓取去各個網(wǎng)站的新聞,一般情況下,新聞網(wǎng)站都會分好類,可以直接記為標(biāo)簽。這個過程是否便可以做成一個產(chǎn)品化的成果。
過去的互聯(lián)網(wǎng)產(chǎn)品,可能我們偏向埋頭于體驗、需求,不太關(guān)注技術(shù)環(huán)節(jié);而在AI產(chǎn)品領(lǐng)域,我們必須要深入技術(shù)運轉(zhuǎn)流程,才能提升我們做出一個優(yōu)秀AI產(chǎn)品的可能性。
3.了解用戶指標(biāo)背后的含義
在評估TI-ONE產(chǎn)品用戶數(shù)據(jù)指標(biāo)時,UV/PV/月活/新增用戶數(shù)等都是我們會去關(guān)注的數(shù)據(jù)指標(biāo)。但若只關(guān)注實際數(shù)值,不去深究背后數(shù)據(jù)增長原因的話,有時會陷入一定的盲區(qū)。比如之前查看產(chǎn)品的統(tǒng)計指標(biāo),用戶數(shù)和日均執(zhí)行任務(wù)數(shù)都是一個穩(wěn)定增長的趨勢,但在用戶調(diào)研中,深入了解了這些在平臺上跑的任務(wù),發(fā)現(xiàn)有一部分任務(wù)大家只用來做調(diào)度,并沒有去使用平臺上的算法模塊,刨根問底了這部分用戶才知道,因為我們平臺上的算法庫是黑盒子,出了問題不好定位,不如自己寫代碼查原因。通過這次對指標(biāo)的剖析,我們也考慮將目前提供的算法進行開源和引入自定義算法模塊,去補充我們對這塊功能設(shè)計的短板。
4.縱向的業(yè)務(wù)理解能力
很多人工智能產(chǎn)品往往跟某一垂直行業(yè)緊緊掛鉤,去解決某一具體問題;這是要求人工智能產(chǎn)品經(jīng)理去深入整個業(yè)務(wù)流程的鏈條,熟悉每一個涉及到的用戶場景;并且在場景中,提煉出用戶最迫切需求并優(yōu)化需求點,實現(xiàn)產(chǎn)品的變現(xiàn)。
很多不同行業(yè)、領(lǐng)域的人工智能產(chǎn)品其實背后所用到的技術(shù)邏輯都大同小異,如人臉識別技術(shù),在安防市場,因人臉難以復(fù)制的特性,它代替了門禁卡。在公安領(lǐng)域,警察可以通過人臉識別,在各大重點區(qū)域,關(guān)口進行人臉的抓拍、識別,對可疑人物的信息可實時推送到警務(wù)終端,大大提升破案效率。在銀行領(lǐng)域,人臉識別可以支持遠(yuǎn)程辦理業(yè)務(wù),刷臉開戶,通過它查驗身份信息,可免去需求親自去網(wǎng)點辦理的麻煩。
技術(shù)是相通,但不同場景的側(cè)重點會有所不同,產(chǎn)品形態(tài)也會有所差異;在銀行領(lǐng)域,人證比對設(shè)備需求會比較強。在公安領(lǐng)域更強調(diào)的是后臺動態(tài)人臉識別系統(tǒng)的使用。
人工智能產(chǎn)品經(jīng)理需要對業(yè)務(wù)場景進行反復(fù)驗證、迭代,從而去判斷結(jié)果概率是否能達(dá)到用戶的標(biāo)準(zhǔn),依照這些判斷去做不同的投入策略。因此,了解算法的基本原理和落地的業(yè)務(wù)場景尤為重要,可以有一個相對清晰的技術(shù)框架,并且懂得在技術(shù)允許實現(xiàn)的范圍內(nèi),規(guī)劃出最優(yōu)方案。
5.關(guān)聯(lián)信息的能力
做人工智能產(chǎn)品需要我們加深對機器學(xué)習(xí)相關(guān)技術(shù)和應(yīng)用的理解。理解好機器學(xué)習(xí)的基本邏輯,數(shù)學(xué)是其背后的原理,如微積分、概率論、線性代數(shù)都是機器學(xué)習(xí)的基礎(chǔ)。而這些數(shù)學(xué)概念和模型往往是抽象、非直觀的。
當(dāng)試著去理順這些相對復(fù)雜的邏輯,可以嘗試關(guān)聯(lián)信息的方法,在不熟悉與熟悉的知識之前建立連接,從個人的經(jīng)驗中,去尋找能夠與所有要理解信息類比的部分,把枯燥難懂的知識點,與實際生活的例子相結(jié)合。
比如說我要學(xué)習(xí)線性回歸,關(guān)于線性回歸,提供的數(shù)學(xué)解釋是假設(shè)自變量與因變量是線性關(guān)系,利用最小二乘法擬合自變量權(quán)重的一種分析方法。若單是看這段解釋的話,會不太容易讓人理解線性回歸是在描述什么;試著去聯(lián)想生活中的經(jīng)驗會幫助理解線性回歸的概念。針對線性回歸這個概念,可以通過房價波動和驅(qū)動因素來做聯(lián)想,假設(shè)我們有1000條關(guān)于深圳房子的綜合數(shù)據(jù),每條數(shù)據(jù)作為一個樣本,內(nèi)含信貸價格、常住人口/戶籍人口、工作人口/常住人口、小學(xué)生在校人數(shù)這些數(shù)據(jù)看作特征變量,房價為目標(biāo)變量。線性回歸解釋的便是這些特征變量對房價波動的影響度。
6.降本提效是推動人工智能發(fā)展的最強動力
人工智能技術(shù)價值的實現(xiàn),最終需要落地商業(yè)化、為行業(yè)帶來價值和形成真實有效規(guī)?;膭傂鑱眢w現(xiàn)。目前大部分人工智能公司在做的是單一的人工智能驅(qū)動產(chǎn)品,如自動駕駛汽車算法、零售領(lǐng)域的刷臉支付、醫(yī)療領(lǐng)域的人工智能影像分析。所有員工工作中的任務(wù)自動化比例將提升,一部分勞動力也會被人工智能所替代。沖擊較大的工種為人工客服、流水線工人、銀行柜臺職員等。
還有一種AI公司,不是去用某種人工智能的能力去替代某一工種的工作,而是完全重塑整個行業(yè)的的勞動力配置,比如阿里的無人酒店,從接待到打掃的服務(wù)員全都是機器人,他們沒有雇傭人類員工,去利用算法取代某種類型的工種;隨著低本、高效和優(yōu)質(zhì)的服務(wù)模式逐漸鋪開并且占領(lǐng)市場,高昂的人力成本可能會導(dǎo)致對手們重新調(diào)整公司對勞動力配置。
根據(jù)來自普華永道的數(shù)據(jù):“預(yù)計到2030年,AI將能為世界經(jīng)濟貢獻(xiàn)15.7萬億美元,這相當(dāng)于目前印度加中國的生產(chǎn)總值總和,中國公司在其中將起到非常重要和關(guān)鍵的作用?!毕嘈挪痪玫膶?,會有越來越多的行業(yè)和人工智能結(jié)合在一起。如何去挖掘行業(yè)的切入點、利用AI去重塑應(yīng)用場景,為實體行業(yè)提升運行效率、甚至顛覆當(dāng)前的傳統(tǒng)的商業(yè)模式,提供一套可行的AI解決方案是AI產(chǎn)品經(jīng)理需要掌握的核心技能。
結(jié)語
當(dāng)有了一定積累,面對工作就會得心應(yīng)手,使人的行為處于一個穩(wěn)定的水平,慢慢有了自己的舒適區(qū),時間久了會不愿離開這樣的狀態(tài)。但若一直沉浸在一個自己非常熟悉的領(lǐng)域,難免被固化了行為,不過是日復(fù)一日發(fā)揮著一個螺絲釘?shù)墓πА?/p>
切換到AI領(lǐng)域發(fā)現(xiàn),這是個一旦不保持自己技能SET更新狀態(tài)便會被淘汰的領(lǐng)域,包括在一個項目組內(nèi)的算法、開發(fā)童鞋,也是每天不斷在學(xué)習(xí),了解當(dāng)前最前沿的知識。
世界總是不斷前進變化和充滿著不確定性,保持著自己所積累的技能和可預(yù)見/突破的挑戰(zhàn)的平衡,逐步爬坡,穿透自己的高墻,才能擁有人生更多的可能性。