周鴻禕路演聊AI,分析師、基金經理瘋狂湧入,電話會被擠爆

中國基金報

周鴻禕認爲,中國廠商和GPT3.5的差距是18個月,GPT4是24個月,比光刻機的難度小多了。

大家好,昨夜的機構路演,擠爆了。券商分析師,基金經理都在聽。

19日晚間,圈內最大的事件,就是大家都在聽AI的電話會會議,直接把app幹爆了,投資者湧入進門財經券商路演直播間,一度導致進門財經APP宕機。據瞭解,進門財經定位是專業投資機構的路演工具,一般是券商、公募、私募、資管、保險等等機構的人用。可以想象,現在的市場熱點全在chatgpt概念板塊上。

民生證券還請來了360紅衣教主的周鴻禕。據說參會人數超過千人!

泰勒找來了這場路演紀要。其中第三個問題把泰勒笑噴了,有人問周鴻禕,以後小孩長大了應該會學什麼專業嗎?週迴答:這個問題很奇怪,該學什麼專業學什麼專業啊

Q:上游哪些場景很關鍵?

A:算力不是最關鍵的問題,場景和數據是關鍵。我們二線隊伍,賬上200多億人民幣,之前國家搞了很多超算中心,沒事情幹,現在發現配了GPU就有東西看。Transformer算法是谷歌發明的,實現靠的是大力出奇跡,幾千億參數。這是個工程問題。從1到n中國能做的很快,openai中國做的很快,谷歌和meta會很尷尬。Meta開源了他的大語言模型,技術的knowhow會快速傳播。關鍵的東西,第一是數據,有知識量的數據做訓練,聊天的語料不包括知識chatgpt中文語料佔了不到5%,大量知識在外文期刊裏面,只用中文訓練語料是不夠的。很多機構說用了很大的參數,但是不敢拿出來說,大概率是數據不夠。還需要人類的槍花反饋學習和調優,激發GPT理解人類的查詢意圖,這個是問題的關鍵。還有個很重要的是場景,微軟放棄了自己的小娜的研究,全力幫助AI,在場景化上可以讓大家看到人工智能有什麼場景。搜索引擎一直在做NLP,自然語言處理,大家都在跟蹤使用,搜索引擎在獲取海量數據方面優勢。我們和百度抓取的網頁在千億萬億的規模,需要清洗辣雞網頁進行工程化的索引。我們搜索引擎要抓取英文的維基百科和語料,對於我們是現成的。初創公司可能會卡在工程化的初始階段,這個對工程化的要求比較高。還有人工標註的調優,微軟做了很多貢獻,搜索引擎幫助很大。360搜索份額佔比30%,百度佔比60%。微軟幫助openai佔據了很多的場景,下一步可能會把teams(視頻會議)等TO B的場景做結合。

Q:以後會不會很多行業不存在了,機器把人替代了?

A:我不是很認同。我認爲這是個洗牌的機會,如果你不重視他,抓上這班車就不行。我們企業內部要起每個部門都用AI提升我們的能力,用AI的大語言模型賦能,這樣會成爲我們手裏有力的競爭武器。GPT4的知識能力和考試的能力已經超越了每一個地球人,GPT可能是用3.5和4互相訓練。我們也考慮過這種,用bert這種理解性的模型進行反饋和獎勵。這是個生產力工具,是能給各個產業賦能的,關鍵是你需要找到相應的場景和場景化的能力。

Q:以後小孩長大了應該會學什麼專業嗎?

A:這個問題很奇怪,該學什麼專業學什麼專業啊,對prompt很敏感。

Q:關於我們360,行業現在是巨頭扎堆,360的核心優勢?

A:第一個問題已經講了,第一是數據的能力,不能光用中文的數據,要有全球數據的抓取能力,要能做到對垃圾的判別和清洗。用戶上億次搜索的數據,我們和百度有知識問答的欄目,這種涉及用戶的真實的使用場景來進行訓練。數據我們有優勢。GPT2和bert是開源的,真要做到上千億上萬億的模型,幾千張GPU的顯卡,幾個T的數據進行幾個億的訓練,這個對工程化要求很高。第三,搜索引擎我們市場份額是百度的一半。搜索引擎不具備生成性,不會編出林黛玉倒拔垂楊柳的故事,生成式AI會無中生有,如果編的結果是不對的普通人很難驗證就很麻煩。我們做泛化,泛化的知識圖譜的搜索,前面的十條二十條結果給大語言模型做提煉,這樣就不會讓生成式AI無中生有。我們搜索引擎dau有一個億,大語言模型可以做及時的翻譯和推薦,我們這種場景可以很好的讓用戶體驗到人工智能的場景,形成商業化的閉環。我在政協叫了個提案,大家忽視的是這個東西真正的破圈了。之前無論是阿爾法狗和蛋白質摺疊,離生活比較遠。得益於微軟工程化產品化的能力。一方面要打造核心技術,全方位最大化的調用公司的資源。大模型的方向已經出來了,要做到大力出奇跡,500億到1000億的參數訓練,用有質量的語料。谷歌現在很尷尬,模型做出來了商業化的場景可能也被微軟搶完了。微軟專注場景和產品化的結合,openai專注技術,這樣能實現很好的效果。

Q:360的場景和應用?

A:並行的。360也在做TO B,也是我們很重視的機會。我們的安全大腦幫助企業抵禦攻擊。我們的機會是,中國企業不接受公有云,希望有個私有化部署的GPT和數據。未來每個企業可能有自己的大腦。只做垂直行業的訓練肯定是不行的(說的就是科大訊飛)。我們離GPT還有24個月到36個月的差距,第一個版本能做到幾百億參數的模型的時候,做到GPT的六成的功力,做到企業內部是夠用了。TO B和TO G端是有大量的機會的。面對中小企業端,我們打算推出生成式AI的辦公套件和應用。Openai找了100家垂直的SaaS公司,會專門訓練垂類的應用。我們這兩年很關注sme(中小企業),中小企業對企業數字化的要求功能明確,少花錢使用簡單,SaaS更合適,我們去年推面向企業的SaaS雲服務,一年120萬家客戶。我們瀏覽器國內份額最大,做了個SaaS商店,我們會找合作伙伴做一些場景。TO C我們有大量的使用場景,瀏覽器加上AI插件變成AI個人助力。TO B,TO SME和TO C三十多個場景使用不同的能力,儘快佔據用戶的使用場景。

Q:我們會和百度一樣芯片模型全覆蓋的平臺嗎?

A:我們肯定不是這個方向。谷歌自己搞過GPU,也就自己用。訓練最好還是用A100和A800,框架沒必要自己搞,自己搞個框架還要花精力和別的芯片適配。微軟這麼強大微軟只做應用,openai用的框架也是用的行業通用框架。我不認爲產業鏈全都做了是好事。我們堅定的沿着transformer框架把模型幹到千億。首先是要佔據應用場景。

Q:百度內測效果不錯,對於360未來應用的推廣是不是更有信心了?

A:百度搜索一哥肯定能做好的,微軟的搜索份額比谷歌要小,可以放開手要做創新。百度爲什麼做一個聊天機器人我不理解,我要做的話可能更願意和搜索相結合。國內我不認爲會和美國一樣一支獨大,頭條和其他互聯網廠商大家不會相互支持,會互相競爭,360啊微博啊B站啊知乎啊小紅書啊美團滴滴等等,他也不敢用巨頭的服務,肯定要自己搞。還是希望在這個模型上做出幾個超級應用。有應用有場景的公司加上模型會有價值。

Q:中國電信佈局了企業版的chatgpt,對這個的關注提升到了國家戰略的高度,國家的重視會對行業產生什麼影響?

A:國家隊幹這個事肯定不是壞事,互聯網上大家都做過。從目前擁有的數據和團隊能力來看,民營企業和國企都在一個起跑線上。只要不是隻要牌照才能搞大語言模型,這樣都有機會。GPT是個生產力工具,這將決定未來國際競爭當中的國運。美國人對於大語言模型也有政治正確的要求。

Q:中國和美國比有24到36個月的時間差?

A:不是和微軟比。GPT4驗證了我們很多觀點,他的參數量我覺得應該到了萬億,訓練的數據比原來大了5到10倍。人類反饋強化學習不再是十萬組,而是幾十萬組的答案對,有很強的智能的能力。目前來看多模態是勝過國內的能力的。國內的圖像識別還是傳統的圖像識別,openai把所有都看做序列,圖像也是序列,他能把圖像組成部分的關係和邏輯相關性總結出來。他在閱讀文檔上的能力國內做不到。他能支持5萬字的輸入,表示他的深度記憶能力越強,對上下文的理解越好。GPT3.5我們認爲國內和他的差距18個月,gpt4是24個月。雲談了這麼多年,企業上雲的比例也還不高。這比光刻機的難度小多了。

Q:怎麼看GPT4,會不會取代操作系統成爲戰略級的入口?

A:這是兩個概念,需要host一個應用需要操作系統,操作系統還是需要的。人工智能沒有突破之前大數據給企業用不好用。Gpt相當於是發電廠,這個比喻比較貼切。純做GPT的公司有點來不及,要麼是有GPT豐厚的場景。場景越大爆發性就越大,如果場景很小,就做了個虛擬人掛個GPT跟人對話,這個場景就很小。場景未來可能有多家服務提供商。

Q:場景是我們非常關注的點,特斯拉的機器人也是爆款,多模態和機器人的關係?人形機器人是終極目標嗎?

A:我不這麼認爲。不考慮機器人的外形,音響之類的用自然語言和人交流這關就是過了。Gpt能否處理好機械手臂,尋找空間定位也是,出了GPT之後傳統的做語言識別的圖像識別的就有問題了。人形機器人有個最大的問題,機械手臂抬起的力量,這和人工智能沒有關係。如果機器人手裏拿不了太重的東西,這可能會成爲妨礙。自動駕駛汽車也是個機器人,只不過長了4個輪子。GPT的大語言都可以賦能。你們和智能音箱聊過天,聊兩句就能知道他是個滯脹,gpt肯定通過了圖靈訓練。橡膠娃娃也是仿真機器人。

Q:GPT4在物聯網終端的廣泛應用是大趨勢了,邊緣計算的需求?

A:這跟邊緣計算有什麼關係呢?構不成邊緣計算的節點。真正的能力都在雲端,運算都在雲端。

本文作者:泰勒,來源:中國基金報,原文標題:《今晚,爆了!分析師、基金經理瘋狂湧入!“馬英九將赴大陸”!熱搜也爆了:張蘭家族信託被擊穿!》

風險提示及免責條款

市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。

責任編輯:石秀珍 SF183

相關文章