劉江
從2022年11月發布到之后差不多半年的時間,ChatGPT所引起的關注、產生的影響,可能已經超越了信息技術歷史上的幾乎所有熱點。 它的用戶數2天達到100萬,兩個月達到1億,打破了TikTok之前的記錄,而在2023年5月它上架蘋果應用商店后,也毫無懸念地沖上了免費App榜榜首。 許多人平生第一次接觸如此高智能、知錯能改的對話系統。雖然它很多時候會非常自信、“一本正經地胡說八道”,甚至連簡單的加減法也算不對,但如果你提示它錯了,或者讓它一步步地來,它就會很“靈”地變得非?孔V,有條不紊地列出做事情的步驟,然后得出正確答案。對于一些復雜的任務,你正等著看它的笑話呢,它卻會不緊不慢地給你言之成理的回答,讓你大吃一驚。 眾多業界專家也被它征服:原本不看好它甚至在2019年微軟投資OpenAI的決策中投了反對票的蓋茨,現在將ChatGPT與PC、互聯網等相提并論;英偉達CEO黃仁勛稱它帶來了AI的“iPhone時刻”;OpenAI的山姆·阿爾特曼(Sam Altman)將它比作印刷機;谷歌CEO孫達爾·皮柴(Sundar Pichai)說它是“火和電”……這些說法都與騰訊創始人馬化騰認為ChatGPT“幾百年不遇”的觀點不謀而合,總之都是說它開啟了新時代。阿里巴巴CEO張勇的看法是:“所有行業、應用、軟件、服務,都值得基于大模型能力重做一遍!币择R斯克為代表的很多專家更是因為ChatGPT的突破性能力可能對人類產生威脅,呼吁應該暫停強大AI模型的開發。 2015年,30歲的山姆·阿爾特曼和28歲的格雷格·布羅克曼(Greg Brockman)與馬斯克聯手,召集了30歲的蘇茨克維等多位AI頂級人才,共同創立OpenAI,希望在谷歌、Facebook等諸多巨頭之外,建立中立的AI前沿科研陣地,并且雄心勃勃地把構建與人類水平相當的人工智能作為自己的目標。那時候,媒體報道基本上都以馬斯克支持成立了一家非營利AI機構為標題,并沒有多少人看好OpenAI。甚至連蘇茨克維這樣的靈魂人物,在加入前也經歷了一番思想斗爭。 前3年,他們在強化學習、機器人、多智能體、AI安全等方面多線出擊,的確沒有取得特別有說服力的成果。以至于主要贊助人馬斯克對進展不滿意,動了要來直接管理的念頭。在被理事會拒絕后,他選擇了離開。2019年3月,山姆·阿爾特曼開始擔任OpenAI的CEO,并在幾個月內完成了組建商業公司、獲得微軟10億美元投資等動作,為后續發展做好了準備。 2020年,GPT-3橫空出世,NLP(Natural Language Processing,自然語言處理)小圈子里的一些有識之士開始意識到OpenAI技術路線的巨大潛力。在中國,北京智源人工智能研究院聯合清華大學等高校推出了GLM、CPM等模型,并積極在國內學術界推廣大模型理念。 2020年底,OpenAI的兩位副總達里奧·阿莫迪(Dario Amodei)和丹妮拉·阿莫迪(Daniela Amodei)(同時也是兄妹)帶領GPT-3和安全團隊的多位同事離開,創辦了An-thropic。達里奧·阿莫迪在OpenAI的地位非同一般:他是伊爾亞·蘇茨克維之外,技術路線圖的另一個制作者,也是GPT-2和GPT-3項目以及安全方向的總負責人,而隨他離開的,有GPT-3和規模定律論文的多位核心人員。 一年后,Anthropic發表論文“A General Language Assistant as a Lab-oratory for Alignment”,開始用聊天助手研究對齊問題,此后逐漸演變為Claude這個智能聊天產品。 2022年6月,論文“Emergent Abilities of Large Language Models”發表,第一作者是僅從達特茅斯學院本科畢業兩年的谷歌研究員Jason Wei(今年2月,他在谷歌的“精英跳槽潮”中去了OpenAI)。他在論文中研究了大模型的涌現能力,這類能力在小模型中不存在,只有模型規模擴大到一定量級才會出現——也就是我們熟悉的“量變會導致質變”。 當年11月中旬,本來一直在研發GPT-4的OpenAI員工收到管理層的指令:所有工作暫停,全力推出一款聊天工具,原因是有競爭。兩周后,ChatGPT誕生。這之后的事情已經載入史冊。 業界推測,OpenAI管理層應該是得知了Anthropic Claude的進展,意識到這一產品的巨大潛力,決定先下手為強。這展現出核心人員超強的戰略判斷力。要知道,即使是ChatGPT的核心研發人員也不知道為什么該產品推出后會這么火(我爸媽終于知道我在干什么了),他們在自己試用時完全沒有驚艷的感覺。 2023年3月,在長達半年的“評估、對抗性測試和對模型及系統級緩解措施的迭代改進”之后,GPT-4發布。微軟研究院對其內部版本(能力超出公開發布的線上版本)研究的結論是:“在所有這些任務中,GPT-4的表現與人類水平接近得驚人……鑒于GPT-4的廣度和深度,我們認為它可以合理地被視為AGI系統早期(但仍然不完整)的版本! 此后,國內外的企業和科研機構紛紛跟進,幾乎每周就有一個甚至多個新模型推出。但在綜合能力上,OpenAI仍然一騎絕塵,唯一可以與之抗衡的,是Anthropic。 很多人會問:為什么中國沒有產生ChatGPT?其實正確的問題應該是:為什么全世界只有OpenAI能做出ChatGPT?他們成功的原因是什么? 對此的思考,到今天仍有意義。(作者系圖靈公司聯合創始人、總編,文章摘自《這就是ChatGPT》有刪減)
|