廣播裏聽到對華裔科學家李飛飛博士的采訪,她2023年出版了一本半自傳書 - The Worlds I see。我找來讀了,是本值得一讀的好書。李飛飛1978年出生於北京,但她和父母,外公外婆一直在成都生活。她15歲隨媽媽來美國,跟五年前來美的爸爸團聚。全家擠住新澤西郊區一室一廳的出租房。她進一所公校讀中學,她小時候就對物理和數學有興趣,一邊克服語言關,一邊勤奮學習。拿到Princeton全獎,本科讀物理。大學畢業後她對computer science和neuroscience都有興趣,選擇了Caltech做兩個方向結合的研究, 獲得博士學位。她在University of Illinois Urbana-Champaign和Princeton短暫任教後去了Stanford。
對她影響最大的兩個人,一個是她媽媽。她大學畢業找花街的工作很容易,讀博的時候拿到McKinsey很好的offer。兩次她跟媽媽說起要賺錢養家,媽媽阻止了她,說她的夢想就是她們全家的夢想,They didn't come this far for her to give up. 她媽媽心髒不好,做過多次手術。她工作以後一直和父母一起生活。第二個人是她高中的數學老師,放學後到老師辦公室做作業,提問聊天。良師變成了益友。她畢業後和老師一家也一直聯係。她父母四處借錢買幹洗店,錢不夠。老師借兩萬給她們湊齊。可惜老師因病英年早逝。
她有自己的試驗室後做的第一個項目是ImageNet. 她從字典的名詞開始,分出22000個categories,每個category找到1000張照片,apply label. 她的想法是machine learning和human learning相似,machine看過這麽多照片之後,可以學會辨別照片裏的object。她開設了一個競賽,提供1000個category的data for training machine, 做computer vision研究的團隊可以比一下機器識別的準確度。競賽第三年,University of Toronto的AlexNet準確度直接提高了10個百分點。AlexNet用兩個Nvidia芯片,24小時連續運作一星期來訓練機器, 剛開始機器每個標簽都是錯的,蘑菇說成瓶蓋,拖車成了電子吉他,但錯誤"trigger corrective signals", "do less of whatever failed, and more of whatever didn't." 1.4 million rounds以後準確度提高到85%。成功來自combination of hardware (Nvidia chip), software (AlexNet algorism) and data (ImageNet pictures). 李飛飛現在的研究側重點是Human Centered Artificial Intelligence.