大模型狂飆突進(jìn)之后,各行各業(yè)關(guān)注的焦點(diǎn),逐漸轉(zhuǎn)移到了大模型的實(shí)用性與商業(yè)化,關(guān)注大模型在具體場景中能解決什么問題。
其中,金融場景是許多大模型廠商和創(chuàng)業(yè)者都很關(guān)注的領(lǐng)域,由于市場規(guī)模大、客戶付費(fèi)能力強(qiáng)、對AI技術(shù)采納早、領(lǐng)域?qū)I(yè)性強(qiáng)易于構(gòu)建數(shù)據(jù)壁壘……這些先天優(yōu)勢,讓金融領(lǐng)域的垂類大模型,展現(xiàn)出極強(qiáng)的落地和商用潛力,同時(shí)也掀起了激烈的市場競爭。
不僅基礎(chǔ)大模型廠商積極向金融領(lǐng)域進(jìn)發(fā),和金融伙伴聯(lián)合推出行業(yè)大模型,一些垂類企業(yè)也在積極研發(fā),Bloomberg率先推出了自研的BloombergGPT……這些面向金融場景的大模型,究竟有何差異呢?
最近,權(quán)威大模型評測榜單C-Eval剛剛更新,其中清華&;智譜Al、OpenAl、商湯科技、容聯(lián)云等位居前列。
高達(dá)50~100億參數(shù)的容聯(lián)云赤兔大模型,專注于金融垂類大模型,其成績表現(xiàn)超過了幾乎所有同等規(guī)模的模型,以輕量級模型躋身GPT4等千億模型為主的TOP梯隊(duì)。
百模大戰(zhàn)之后,通用大模型成為少數(shù)玩家的游戲,更小參數(shù)、更易部署、更懂行業(yè)、更低落地成本的垂類大模型成為諸多行業(yè)和企業(yè)用戶關(guān)注的焦點(diǎn)。
我們不妨以表現(xiàn)突出的容聯(lián)云赤兔為例,來聊一聊大模型在垂直行業(yè)的落地,究竟該點(diǎn)亮哪些技能點(diǎn)。
赤兔飛馳
在大模型賽場一戰(zhàn)成名
赤兔,被認(rèn)為是馬中之王,是戰(zhàn)場上日行萬里的悍將。從這個(gè)角度看,容聯(lián)云赤兔確實(shí)“模如其名”,在百模大戰(zhàn)中展現(xiàn)出和赤兔馬一樣的風(fēng)采:
首先是快。今年7月,容聯(lián)云在上海世界人工智能大會上發(fā)布了赤兔大模型,成為行業(yè)首個(gè)專注金融垂類大模型,到今天躋身權(quán)威榜單第六,崛起速度是非常迅疾的。
其次是猛。C-Eval是由清華大學(xué)、上海交通大學(xué)和愛丁堡大學(xué)合作構(gòu)建的面向中文語言模型的綜合性考試評測集,包含13948道多項(xiàng)選擇題,涵蓋52個(gè)不同學(xué)科和四個(gè)難度級別,是目前較為權(quán)威的中文AI大模型評測榜單。赤兔大模型能躋身TOP梯隊(duì),獲得第六的成績,屬實(shí)是垂類大模型的一員猛將了。
垂類大模型更重要的是精。因?yàn)榇竽P吐涞氐囊粋€(gè)普遍痛點(diǎn),是場景和效果不確定,將大模型和金融行業(yè)需求精準(zhǔn)對接,需要在數(shù)據(jù)工程、知識工程、提示工程、應(yīng)用探索等多方面,下“巧功夫”。目前,赤兔大模型已經(jīng)探索出了一些垂直場景,比如其賦能的溝通智能2.0,專注解決客服和營銷場景下的知識庫、人工座席輔助及陪練、問答機(jī)器人、金牌銷售等需求,精準(zhǔn)釋放大模型的技術(shù)價(jià)值。
總體來說,容聯(lián)云赤兔不僅在大模型評測賽場上一馬當(dāng)先,更重要的是,其在實(shí)用性和商業(yè)化探索上也邁出了重要一步,展現(xiàn)出國產(chǎn)大模型的落地速度和商用潛力。
金融+大模型
需要一個(gè)“四邊形戰(zhàn)士”
當(dāng)許多大模型廠商和創(chuàng)業(yè)公司,在為如何回收高昂的模型訓(xùn)練成本發(fā)愁的時(shí)候,容聯(lián)云赤兔所走的垂類大模型之路,展現(xiàn)出了較為清晰的商用前景和價(jià)值轉(zhuǎn)化能力。
不由地使我們好奇,容聯(lián)云赤兔究竟做對了什么?一言以蔽之,大模型在垂直行業(yè)的落地需要的是在知識、數(shù)據(jù)、可信、成本等層面沒有短板的“四邊形戰(zhàn)士”,容聯(lián)云正是將這些工作做到前面、做到實(shí)處、做出差異化競爭力,才能一馬當(dāng)先。
1.知識層面。機(jī)器學(xué)習(xí)的模式是提出抽象化特征并反向輸送給機(jī)器,從而實(shí)現(xiàn)智能,大模型也不例外。但到底提取什么特征,如何給出評估決策,這些環(huán)節(jié)都存在大量領(lǐng)域知識和行業(yè)Know-How。不搞清楚這些問題,缺少知識驅(qū)動,大模型只能“大力出奇跡”,一味追求龐大規(guī)模參數(shù),帶來產(chǎn)業(yè)落地難以承受的高成本、部署難度、幻覺和不確定性。
為解決這一問題,“赤兔大模型”結(jié)合金融領(lǐng)域知識進(jìn)行訓(xùn)練,可以真正理解客戶的開放問題,根據(jù)不同的業(yè)務(wù)需求和場景特點(diǎn)匹配相應(yīng)回答,提高金融服務(wù)的效果。
2.數(shù)據(jù)層面。AI離不開數(shù)據(jù),大模型尤其依賴超大規(guī)模的數(shù)據(jù)積累和標(biāo)注。同時(shí),要讀懂垂直行業(yè)如金融場景,只有通用數(shù)據(jù)還不夠,必須學(xué)習(xí)豐富的金融語料來深度理解金融內(nèi)容,以保證大模型生成內(nèi)容的質(zhì)量和準(zhǔn)確性。而領(lǐng)域數(shù)據(jù),往往涉及到行業(yè)機(jī)密和隱私數(shù)據(jù),是很難獲得的、高壁壘的。這一點(diǎn)上,赤兔大模型展現(xiàn)出了特別的優(yōu)勢。據(jù)了解,容聯(lián)云首先通過開源和公開數(shù)據(jù)讓赤兔大模型獲得基礎(chǔ)能力,然后依托容聯(lián)云長期積累的金融、營銷等領(lǐng)域數(shù)據(jù)構(gòu)建領(lǐng)域模型,以解決特定行業(yè)的問題。在實(shí)際服務(wù)過程中,進(jìn)一步基于業(yè)務(wù)數(shù)據(jù)和行業(yè)知識進(jìn)行模型迭代,不斷提升赤兔大模型對金融的理解能力。
3.可信層面。金融業(yè)“穩(wěn)健經(jīng)營”的要求,是一個(gè)嚴(yán)謹(jǐn)嚴(yán)肅的復(fù)雜場景,對大模型的可信、可靠、可解釋等要求非常高。如果大模型在生成過程中出現(xiàn)幻覺、答非所問、無中生有,這對于需要精準(zhǔn)決策的金融用戶是無法接受的。解決這一問題,一方面需要專門的算法、數(shù)據(jù)工程等進(jìn)行質(zhì)量控制,同時(shí)要選擇恰當(dāng)?shù)膱鼍安⑦M(jìn)行定制,以達(dá)到金融客戶采購所要求的質(zhì)量。比如,赤兔大模型聚焦在一些容錯(cuò)率較高的場景,如客服、營銷等,金融機(jī)構(gòu)借助赤兔大模型,可以生成一套金牌話術(shù),在電話咨詢等環(huán)節(jié)提高在線留存率,避免客戶流失,進(jìn)而提高交易成交率。在一些交易類的敏感業(yè)務(wù)、用戶體驗(yàn)要求極高的投訴類業(yè)務(wù),“赤兔”的進(jìn)入也更加謹(jǐn)慎,用更長的周期來探索。
4.成本層面。一個(gè)共識是,行業(yè)和企業(yè)引入大模型是為了用的,為了降本增效發(fā)揮價(jià)值的,不是為了跟別人比拼先進(jìn)性的。用大模型就要考慮到投入產(chǎn)出比。不僅企業(yè)用戶要考量大模型的使用成本,對于大模型的開發(fā)廠商來說,面對不低的訓(xùn)練推理和長期維護(hù)成本,也需要在研發(fā)投入和商業(yè)回報(bào)周期之間進(jìn)行平衡。
容聯(lián)云CEO孫昌勛曾提到,在實(shí)際落地場景中,金融客戶更多使用十億級參數(shù)規(guī)模的模型來完成服務(wù)。所以,赤兔大模型在參數(shù)規(guī)模和模型性能之間做到了極高的效率,以50~100億的參數(shù)達(dá)到了極高的生成能力,為客戶提供更高的性價(jià)比和滿足私有化部署的要求。以智能客服領(lǐng)域?yàn)槔?,基于赤兔大模型,容?lián)云生成式一體化智能客服平臺,能將知識生產(chǎn)效率提升70%,對話構(gòu)建成本下降80%,將服務(wù)效率翻倍。
不難看出,大模型要落地金融行業(yè)并不簡單,至少要具備“四邊形戰(zhàn)士”的條件,才能在產(chǎn)業(yè)化道路上快速前進(jìn),這也是容聯(lián)云赤兔“一馬當(dāng)先”的特別之處。
一馬當(dāng)先
垂類大模型向何處去?
我們都不希望大模型的火爆只是曇花一現(xiàn),而是深度融入產(chǎn)業(yè)智能化,實(shí)現(xiàn)長期繁榮。垂類大模型如何走的更遠(yuǎn)?容聯(lián)云赤兔大模型的戰(zhàn)略選擇,在今天也非常值得我們思考。
具體來看,容聯(lián)云赤兔在幾次選擇中都選對了:
大模型的目標(biāo),選擇了“致用”。
作為行業(yè)大模型的初入局者,容聯(lián)云將大模型應(yīng)用的立足點(diǎn)放在自身優(yōu)勢行業(yè)——從2013年開始積累的金融行業(yè),面向服務(wù)的上萬個(gè)客戶,提供匹配當(dāng)前大模型能力和需求的產(chǎn)品,在客服、營銷等場景中先完成落地。
孫昌勛曾說過,行業(yè)大模型不是無限制地攀登技術(shù)高峰,而是在滿足客戶需求的前提下,盡可能節(jié)省成本。聚焦場景,解決具體問題,赤兔大模型的致用,才有后續(xù)的無限可能性。
大模型的優(yōu)勢,選擇了“高能”。
從年初快進(jìn)到“百模大戰(zhàn)”,我們看到太多企業(yè)和創(chuàng)業(yè)公司為了追逐“風(fēng)口”而入局大模型,卻沒有考慮到后續(xù)的模型、商業(yè)等問題,要么倉促離場,要么模型推出后很快無人問津。
大模型落地業(yè)務(wù)場景的過程,不是一蹴而就的,后續(xù)還需要業(yè)務(wù)對接、數(shù)據(jù)互通、應(yīng)用探索、平臺建設(shè)、運(yùn)維服務(wù)等一系列工作。容聯(lián)云就非常注重大模型的長期能力:
具備云通訊領(lǐng)域老兵的優(yōu)勢,形成了“通訊+數(shù)據(jù)+智能”的綜合技術(shù)能力,為赤兔深入金融場景,提供技術(shù)上的“硬實(shí)力”。此外,大模型會涉及到敏感隱私數(shù)據(jù),因此來自行業(yè)客戶,尤其是金融行業(yè)的信任,是大模型廠商至為關(guān)鍵的“軟實(shí)力”。據(jù)了解,容聯(lián)云已經(jīng)和數(shù)家標(biāo)桿性客戶進(jìn)行聯(lián)合共創(chuàng),每家客戶都專門派了團(tuán)隊(duì),和客戶一起做大模型之下的行業(yè)應(yīng)用、產(chǎn)品迭代和更新,這又會進(jìn)一步增強(qiáng)雙方的聯(lián)接和信任,為“赤兔”的產(chǎn)業(yè)化鋪下道路。
大模型的商業(yè)化路徑,則一開始就選擇了聚焦“行業(yè)”。
大家應(yīng)該都聽過“田忌賽馬”的故事,在白熱化的市場競爭中,恰當(dāng)?shù)牟呗圆拍塬@得商業(yè)化成功,形成良性循環(huán)。大模型的持續(xù)發(fā)展,離不開行之有效的產(chǎn)業(yè)化策略。正如容聯(lián)云創(chuàng)始人兼CEO孫昌勛所說,AI大模型更應(yīng)該聚焦到行業(yè),聚焦到客戶需求。相比涉及各領(lǐng)域的通用大模型,企業(yè)其實(shí)更需要專精于某一領(lǐng)域的行業(yè)大模型。因此,在選擇赤兔大模型的應(yīng)用場景時(shí),容聯(lián)云優(yōu)先考慮的還是匹配客戶需求以及商業(yè)化空間,加速了赤兔大模型的落地和價(jià)值兌現(xiàn)。
有一句俗語,說“努力”是速度,“選擇”是方向,方向錯(cuò)了,越努力反而越快走向失敗。
對于成本高昂、競爭激烈的大模型,面對群雄逐鹿的局面,更需要謹(jǐn)慎出手、做對“選擇”。
像容聯(lián)云赤兔這樣,在垂類場景里深耕,不斷錘煉“四邊形戰(zhàn)士”的能力。
這條腳踏實(shí)地的路,才是大模型行穩(wěn)致遠(yuǎn)、做深向?qū)嵉恼_方向。