Tag Archives: 人工智能

AI寫code實戰心法

看網絡上講AI寫code的實在太多外行充內行,甚至開班賣課賺不懂寫程式麻瓜的錢,實在看不過眼,在thread上嗆他們一句半句只是耍樂子。倒不如自已執筆寫一篇AI實戰文章,公開地打他們的臉,引他們過來我主場留言反駁。

有人會問我是什麼來頭,有什麼資格說三道四?我是行內人在一線AI大廠的工程師,早幾個星期剛剛完成公司內首個「AI工程師」的部署。不過職銜和公司名片只是用來唬人,真正的資格是因為工作關係,見識過無限GPU和無限tokens的威力,隱約看見今個世代基於LLM的AI技術的極限在那兒。

這篇文章是全人手寫,幫助腦袋思考的副產品。若果文筆不通順有錯字,廣東話入文看不慣,讀起來沒有起承轉合,讀者請自行餵給AI書僮伴讀。反正在AI年代,把乾貨的真知識記錄下來才最重要,日後有時間才叫AI編輯潤筆添加水份,一魚多吃。癈話不多說,讓我一一戳破網絡偽AI達人常說的廢話。

教人使用便宜的開源LLM去寫code

不要浪費時間在次等的LLM上,因為你的時間更寶貴。沒錯開源LLM的確很便宜,亦只是落後頂尖LLM三個月,但在AI世界三個月就等於人類的三年,你不會想用過時的技術吧。撇開愛祖國用國貨的因素,最大問題是你不知道何時LLM會鬼打牆,頂尖的LLM不是萬能,但遇到鬼打牆的機率少很多。你的時薪也不只二十美元,只是遇上幾次鬼打牆,你浪費掉的時間已經比頂尖LLM的月費更貴。

那便宜的LLM是否亳無用處呢?當然不是,自已用就要用最好,給別人用就要考慮成本將貨就價了。若果你十份肯定一些情況,便宜的LLM足已能勝任,用頂尖LLM就殺雞用牛刀了。寫code時有些簡單的任務,不妨交給便宜LLM去執行。若果你不太肯定,專業的做法就是先用頂尖LLM做了出來,然後建立評估去測試省錢的下限,LLM沒有最便宜只有更便宜,若8B模型能用說不定本地內建的1B也能成功呢。

教人使用no code平台去開發應用

不知何解,網絡上有一票教n8n的AI導師,很好奇他們是否收了讚助費,或是拿上一個cycle流行no code時代的東西出來循環再用。我不是因為自已是工程師所以輕視no code平台,我沒有用過n8n但我有微軟Power Automate的證書資格,公司有一半的東西是使用M365,未有AI前我自已也畫了不少flow去自動化流程,在Linux的另一半當然是shell script更加好用。

若果你今年一月時問我,那時MCP還未一統江湖,GPT5世代的推理模型還未面世,我會認同使用no code平台很正路,至少比去年流行的langchain/graph,用古怪的python語法寫workflow來得直覺。可是到十月還在教人用n8n的人,大慨就是把心思用在編寫課程打廣告收生賺錢,沒有花時間繼續進修追上一日千里的AI發展。若用Claude Code或Codex作為AI agent的開發基礎,接駁好MCP後,剩下的工作就只是寫system prompt。若果用no code平台畫出來,就是把所有connector全接到中間那個大方塊,畫完等於沒有畫。

今年有不少新世代的agentic framework面世,那個最好用目前下結論還太早。領先的兩大廠分別有Codex同Claude Code的agent SDK,Google和微軟緊隨其後,人家有什麼功能就抄什麼。獨立開源的我使用過huggingface的smolagent和後MCP時代的fastagent,而後者我更增添一個我公司需要用的小功能,發送了pull request回饋開源社群。我想要過多久時候,網絡AI導師才會教agent SDK,這些真正實用的東西呢,恐怕到時這些東西又可能過氣了。

Vibe Coding 無用論 / 萬能論

要說2025年度詞語 ,肯定是Vibe Coding一詞莫屬,年初由大神Andrej Karpathy發明,來形容全AI不經人手開發程式。群眾對Vibe Coding的反應兩極,一邊廂說普通人現在也可以寫程式,工程師軟件開發人員全部失業,另一邊廂說Vibe Coding寫出來的只是玩具,不可能拿出來作實際應用,還有更恐怖的資安外洩,整個資料庫被AI清空等都市傳說。

當外行人為Vibe Coding爭辯過不亦樂乎之際,專業的早已全面擁抱AI寫Code,科技大廠超過70%程式碼由AI生產不是神話,我自已團隊就AI生產超過200%的程式碼。你問有可能超過100%嗎?有,因為AI生產出來的有很多垃圾不能用。AI不是無用亦不是萬能,只是一件很好用的工具,需要學習才能有效地靈活運用。

在我對AI基礎技術的認知上,與其說LLM是人工智能近似人類思考,不若說LLM更像是MySQL那類的算力黑箱引擎。明白了LLM的運作原理,就不會有在與AI對話的幻覺。實際的流程是prompt+context輸入,LLM另一頭輸出一堆文字。若果輸出有問題,正確的做法不是與AI繼續對話,而是改變另一組輸入再嘗試,這個輸入到輸出驗證再試的輪迴,以前我們叫它做debug。

Vibe Coding並不是新事物,未有AI人工智能前它的名字是印度外判,也算是另一種AI(Actual Indians)。沒有管理和系統架構經驗的初級工程師,習慣所有程式碼一手一腳自已包辨,手腦合一沒錯是寫code又快又靚,但極限是一個人一天只有二十四小時。當你的項目超過你一個人的能力時,就要帶領團隊分工合作才能完成。傳統上資深工程師負責架構,初級工程師負責執行,只要薪火相傳把知識教授給後輩,上級不用去費心執行細節上的問題。

可是印度外判的出現,完全顛覆這種師徒制的理想開發環境。外判就是要節省成本,結果就是一分錢一分貨,印度外判對工作亳不上心,說漏一句就亂來錯誤百出,就好像現在的AI一樣。不知是幸運還是不幸,當年我帶領五十人的外判團隊,原本一心只想當個輕鬆發號司令的經理,結果白天我要親自把的技術執行拆件細分,寫好文件和檢收要求分發給外判去做,晚上就和他們開會做code review,他們亂來就拒收發回重做。相對起來AI比外判實在太好用了,至少AI不會明明做錯還堅持自已是對的,要我花半小時去證明為什麼他做錯了。總之受過印度外判痛苦洗體的資深工程師,早已學懂了如何運用AI去Vibe Coding的技巧,說穿了就是engineering最基本的常識,divide and conquer, clear specification, automated acceptance test。

哲學上有個無限猴子理論,若果給無限隻猴子無限台打字機,邏輯上遲早會打了部一莎士比亞名著出來。在AI比猴子聰明,大約比印度外判好一丁點,我發明一個無限印度外判理論,只要有無限GPU和無限tokens,AI遲早會寫出你想要的程式。

有AI不需要讀文科

台灣成功大學歷史系,今年破天慌一個新生也收不到,校方歸究於受AI浪潮影響。然後有歷史教授跑出來為自己的專業辯護,無視現實硬推銷說讀文科很有用,引來一眾被社會邊緣化的文科人出來圍爐取暖,甚至大言不慚地說理工科技人,只懂賺錢沒有文化修養云云。

本來別人喜歡讀什麼書,把學問視為一門興趣,理應要互相尊重。不同嗜好各有所愛,無分高下貴賤。偏偏文科人不事生產之餘,還要自嗚高人一等,把自已世界觀以為是放諸四海的真理,天真的以為文科的文化才是文化,理工的文化不是文化。怎會不引來理科組的強力批評,尤其是懂寫字的理工人。

文科人要乖乖地知道自己在社會上的位置,認清自已沒有生產力,要接受其他有生產力的人供養的事實,不要自嗚得意向他人指指點點,才不會惹來非議。娛樂工業很清楚自己的位置,潮流時裝也很清楚自己的位置,文科的位置與娛樂和潮流的位置差不多,搞不好地位還更低,因為文科「產品」沒有市場需求。

當然我不是一竹篙打一船人,也不是說不能賺錢的學問沒有價值。大學當然應該要做學術研究,但要做什麼研究才對得起納稅人的金錢呢?基礎科學研究吃力不討好,但科研是國力立國之本,大學受資助完全沒有爭議。很多統稱為文科組的學科,性質上屬於軟科學(如心理,經濟,語言學等),大部份也是對社會有用的知識。至於哲學為不分文理所有學科的根本,大學中有哲學研究,作為其他各科必修的哲學課,也沒有太大爭議性。可是剩下來其他無用的文科呢?例如有必要花時間精神在大學裏研究紅樓夢嗎?

現今世代以大型語言模型LLM為基礎的AI人工智能,看似非常聰明,實際上十分愚蠢。只是把語言文字以統計學方式去重新排列呈現,並不理解現實世界或抽象慨念,也就是說AI本身沒有知識亦不懂思考。在一般傳統上知識為基礎的學科,不論是硬科學還是軟科學,AI只是一件輔助工作,令那些領域的專才如虎添翼,因為AI不可能取代他們腦中的知識。反觀一些沒有客觀事實為根據的學科(如文學,藝術創作,非考古的歷史),從認知學的理論去看,那些學科嚴格來說不能算是知識,只不過是某學術小圈子的觀點和意見。AI生產出來的文科文章,與那些蛋頭學者寫出來的文章,兩者並列在一起,誰也沒有比誰分高低。

純文科的東西本來已經沒有多少人看,一按鍵就能生產出無數同樣的東西,而且因為沒有客觀對錯的限制,完全避免LLM應用上結果有幻覺的死穴。AI生產主觀意見的成本接近零,蛋頭學者要吃飯要生活,在經濟學的供求定律下,文科學者最終必然被市場淘汰。

ChatGPT投資攻略

先致聲明,這篇文章不是ChatGPT寫的,是我用人腦智能寫的。

近日ChatGPT人工智能平地一聲雷,憑空出世橫掃各大新聞媒體,更成為史上用家增長最快的網站。短短五天便超過一百萬用戶,一個月極速成長至一千萬用戶,比Instagram,Netflix,Spotify,甚至Google的早期增長更驚人。中國香港的朋友,可惜未能親身體驗ChatGPT的強大,我第二天就已經開了戶口試玩。文末附有些ChatGPT的例子,可供大家作參考

上個月公司要寫下屬的考核報告,員工最關心只是評分等級高低,直接影響升職加人工分花紅,報告內容本身只是例行公事,沒有人會花心機細看。我索性用ChatGPT幫我寫,先把評語用簡單句字例出,然後叫ChatGPT替我編輯重寫潤飾文章,一篇很專業模樣報告就出爐,不用以前那樣找樣本左一抄句右一抄段,又擔心寫錯英文文法那麼麻煩。我可以斷言ChatGPT或類似的人工智能系統,將會為白領工作帶來翻天覆地的改變,會像電腦,互聯網,手機般帶來的全新商業革命。

ChatGPT是OpenAI開發的大型語言模型,用人工智能「消化」網絡上廣大文字庫,「提煉」出一個簡易使用的交談系統。這篇不是電腦科普文,我不去解述ChatGPT的運作原理了。ChatGPT是基於GPT-3第三代的語言模型,OpenAI正個開發第四代,語言庫將更巨大更多函數。現今生成人工智能才剛剛起步,OpenAI成立還未夠十年,難以想像十年後發展會如何一日千里。蘋果也只是用了十年多的時間,把iPhone從無到有一統手機市場,暴發成全球最高市值的公司。

雖然很行貨我也要講,ChatGPT技術的最佳投資是自已,不斷學習新科技才不會被淘汰。新科技不會取代人類,而是懂得使用科技的新人類,取代不懂使用科技的舊人類。不論是產生文字或圖畫,過幾年可能包括影像和3D模型,生成人工智能將會取代大量的低端工作。搬字過紙的文字工作者,例如內容農場作家,娛樂版記者,寫公式通告的文員,ChatGPT將會直接取代。至於有獨特見解創新內容的文章,或需要專業知識作出判斷,這一個世代的人工智能其實仍然很蠢,大慨我們退休前也未能威脅。

OpenAI不是上市公司,我們一般市民無法直接投資。早兩日Buzzfeed傳出消息,說他們會引用ChatGPT寫垃圾文,股票爆升三倍,我看是虛火炒作居多,現在才跟風入市,就準備當韮菜。下面我會推介一些與ChatGPT相關的長線投資:

Microsoft
有看財經新聞的也知道,微軟注資一百億入OpenAI,換取未來七成收益。因為OpenAI是一間很另類的非牟利企業,微軟投資利潤封頂於一百倍回報,最多只能拿回$1T。微軟從OpenAI直接的利潤,遠遠不及衍生出其他的商業機會。OpenAI運行在Azure雲上,現在也是微軟出錢讓大家免費玩ChatGPT,其他公司購買的優化版本ChatGPT,很順理成章也是要租Azure去行。微軟早兩年收購了Nuance,在技術上Nuance是上一代的人工智能,但伴著它買回來的客戶關係,升級新一代人工智能已是一個金礦。微軟還有LinkedIn,Github等策略性收購,全部可以用應用人工智能擴展新業務。只要微軟不犯錯自已搬石頭砸自己的腳,它已經穩坐人工智能的龍頭位置。

Google
有些分析亂說ChatGPT會取代Google的搜尋業務,我可以肯定告訢你這不會發生。問題不是ChatGPT回答有多捧,而是ChatGPT的能源消耗和搜尋引擎根本不同層次,單是電費不可能乎合成本效益。大家不要忘記Google是人工智能王者,ChatGPT中T代表的Transformer,就是Google發明出來的東西。技術層面上Google絕對不輸OpenAI,它要弄另一個差不多的系統出來不是難事。後發追上二分天下更是Google的拿手強項,手機有Andriod當iPhone的萬年老二,智能家居語音系統OK Google更超越Amazon Alexa。一市獨大很少出現,最後結果很有可能就是Google同微軟平分天下。

Nvidia/AMD/Intel
淘金熱最發達是買鏟子的商家,人工智能全靠晶片才能運行。Nvidia的晶片是人工智能首選,它多年來深耕的CUDA軟件技術,基本上目前除此以外沒有任何其他選擇,所以綠廠的市值,比紅廠和藍廠加起來還大。硬件上紅藍綠廠各有所長,沒有誰有絕對的優勢。身為客戶巨企不喜歡軟件受別人控制,刻意扶殖紅藍兩廠打壓綠廠的氣焰,也有投資其他人工智能晶片的新晉公司和自行開發晶片。除了剛剛從Intel分拆出來的Mobileye,印象中還未有其他上市的人工智能晶片。晶片start-up是高風險高回報的投資,一眾未上市的細廠中,我無法預知最後誰會跑出。值得一提是Cerebras Systems,整塊wafer不切割做成一塊超巨大晶片,若果它上市我會買股博一舖。這間創新公司大慨不成功便成仁,一是走進技術的死胡同破產收場,一是引發晶片設計的新革命,沒有中間不過不失的可能性。順便申報利益,我在其中一間返工。

Tesla
人工智能又關電動車的事?嚴格來說Tesla同ChatGPT沒有直接關係,只不過OpenAI是Elon Musk一手創立,更是OpenAI董事局成員。雖然他把股份全買了給微軟,他在OpenAI仍然十分有影響力。Elon Musk的手上其他公司沒有上市,Twitter目前還是一團糟,SpaceX完全沒有計劃上市,只有Starlink有可能會上市。想投資Elon Musk,就只有買Tesla一途。將來OpenAI的人工智能技術成功發圍,Tesla肯定有內線可以飲頭啖湯,足以令它更加拋離競爭對手。

不要因為一間公司宣佈會引入OpenAI或其他類似的人工智能系統,就盲目的跟風去買股票入市。ChatGPT只是一件工具,本質上同spreadsheet或者database沒有多大分別。一間公司的利潤來自其核心競爭力,使用新科技只是輔助性質,而且引入新技術需要適應期,不會一用OpenAI業績就立即上升。反過來當生成人工智能普及化後,到時若果有還未上船的公司,就注定會被時代淘汰,不妨大膽沽空。正如今時今日,見到一個還用在紙檔案不用database公司,幾乎肯定它遲早執笠。

附錄:

把第二段開首譯成英文:

Last month, my company had to write performance evaluations for subordinates. Employees were most concerned with the level of the evaluation, as it directly affected promotions and bonuses. The content of the report itself was just routine, and no one would take the time to read it carefully. I simply used ChatGPT to help me write it. I first gave it a list of simple phrases for the evaluations, and then asked it to edit and rewrite the report to make it look professional.

重寫第二段開首:

上個月我之公司須為下屬寫考評報告,僱員最關心者僅為評分等級之高低,直接影響升職加工資。報告內容本身僅為例行公事,無人會費心看。我遂以ChatGPT為我寫,先將評語用簡單句字例出,然後命ChatGPT為我編輯重寫潤飾文章,一篇很專業模樣之報告即出爐。

總結第二段開首:

作者使用了ChatGPT為其公司寫一份績效考核報告。他們提供了簡單的評價短語,並要求ChatGPT編輯和重寫報告以使其更專業。

Godel, Escher, Bach: an Eternal Golden Braid – Douglas Hofstadter

最初遇上這本書是大學一年級時,從電腦學會師兄的極力推介,他們把這本書捧為人生必頭的神作。可惜當年我程度不夠,翻了幾頁便給這本磚頭書嚇跑了。畢業至今十多年,我偶然也會聽見這本書的大名,久不久身邊便有人說此書乃非看不可的經典,對他曾有多深的影響,甚至改變了他對世界的看法。事隔十六年,我終於與此書再續當年在大學書店結下的前緣,前後花了三個月時間,慢慢把這本七百多頁的鉅著啃完。今年原本計畫看二十本書,為看這本只好重質不重量,這本書一本大慨抵得上十本書吧。

這本書一般簡稱為GEB,作者花了十年時間才寫成,亦是他的第一本書,結果讓他舉成名,此書還奪得普立茲獎。Godel是數學家,發現不完全定律。Escher是畫家,以超現實的素描聞名,書中有大量他的畫作插圖。最後Bach是古典音樂家,他的樂章很複雜工整,把音符玩得出神入化。書中想想提及他的作品,可惜這本不是電子音沒有聲音,要自已上去Youtube聽。對於音樂的門外漢,只是聽也不易明白Bach音樂的美妙,Youtube上附上樂譜動畫,看音階不斷的位置重覆交錯,才看得出Bach作曲的鬼斧神工。數學,畫,音樂,作者從三種看似無關係的東西出發,慢慢地解釋教授各關的知識,用畫和音樂去輔助講解數學理論,交織出一個人類的自我意識是從何而來的答案。

這本書的篇排很有心思,每一章之前有一段對話錄,幾個作者創造的角色在對話,大玩文字遊戲並發問啟導性的問題,可以視為接下來嚴肅內容的引言。這本書的上半部,從零開始便是去解釋歌德爾的不完全定律,由最基本的formal language,到number theory,到propositional calculus,一路由淺入深帶領讀者推論出Godel’s incomplete theorems,數學理論中必定不完全或內有矛盾。最重要是同時帶出strange loop異圈這個慨念,任何有自我指向特性的系統便是一個異圈。

下半部涉獵的知識甚廣,包括人工智能電腦程式,基因和蛋白質的構造,人腦神經系統的構造等等。透過很多不同的科學中也隱含的異圈,作者嘗試解答心靈哲學中最重要的課題,到底什麼是智慧,什麼是思考,人類的自我意識是什麼。在低階組織的物理層面,腦部只是機械性化學反應,並沒有任何意識。可是當高階組織有了自我修改,自我指向的異圈結構,並不再限於機械式反射作用,意識便會從異圈中產生出來。

我買那本書的二十周年紀念版,在書首作者加入了一篇導讀,因為實在太多讀者誤解了此書。好處是讓我已經知道書本的主旨說什麼,某程度上幫助我不至半途而癈。可是同時卻剝奪了我閱讀的樂趣,失去了當作者把書本中所有說過的所有知識,總結整合申引出自我意識理論時,讓我妨然大悟解謎的感覺。另外作者有偷懶之嫌,書中有些資料已經過時,例如電腦下棋,電腦翻釋等等,作者應該趁二十周年紀念版的機會,更新書中的內容與時並進。不過這些小問題,並不影響此書跨越時間的經典地位。