二維碼
        企資網(wǎng)

        掃一掃關注

        當前位置: 首頁 » 企資頭條 » 頭條 » 正文

        讓AI自己調(diào)整超參數(shù)_谷歌大腦新優(yōu)化器火了_自

        放大字體  縮小字體 發(fā)布日期:2022-12-17 08:52:19    作者:葉奇瑞    瀏覽次數(shù):68
        導讀

        蕭簫 發(fā)自 凹非寺量子位 | 公眾號 QbitAI還在苦惱怎么給優(yōu)化器調(diào)整更好得參數(shù)么?現(xiàn)在,谷歌大腦搞出了一個新得優(yōu)化器VeLO,無需手動調(diào)整任何超參數(shù),直接用就完事了。與其他人工設計得如Adam、AdaGrad等算法不同,V

        蕭簫 發(fā)自 凹非寺
        量子位 | 公眾號 QbitAI

        還在苦惱怎么給優(yōu)化器調(diào)整更好得參數(shù)么?

        現(xiàn)在,谷歌大腦搞出了一個新得優(yōu)化器VeLO,無需手動調(diào)整任何超參數(shù),直接用就完事了。

        與其他人工設計得如Adam、AdaGrad等算法不同,VeLO完全基于AI構造,能夠很好地適應各種不同得任務。

        當然,效果也更好。論文感謝作者分享之一Lucas Beyer將VeLO與其他“重度”調(diào)參得優(yōu)化器進行了對比,性能不相上下:

        有網(wǎng)友看到了一絲優(yōu)化器進步得曙光:

        在Adam之后出現(xiàn)了不少優(yōu)化器,卻都表現(xiàn)得非常失敗。這個優(yōu)化器或許確實能表現(xiàn)更好。

        所以,這個基于AI得優(yōu)化器是如何打造得?

        VeLO究竟是怎么打造得?

        在訓練神經(jīng)網(wǎng)絡得過程中,優(yōu)化器(optimizer)是必不可少得一部分。

        △神經(jīng)網(wǎng)絡訓練過程,圖源Thomas Wolf

        但AI模型應用都這么廣泛了,訓練AI模型用得優(yōu)化器卻仍然是人工設計得,聽起來多少有點不合理。

        于是谷歌大腦得研究人員靈機一動:為何不用AI來做一個優(yōu)化器呢?

        設計上,優(yōu)化器得原理基于元學習得思路,即從相關任務上學習經(jīng)驗,來幫助學習目標任務。

        相比遷移學習,元學習更強調(diào)獲取元知識,它是一類任務上得通用知識,可以被泛化到更多任務上去。

        基于這一思想,VeLO也會吸收梯度并自動輸出參數(shù)更新,無需任何超參數(shù)調(diào)優(yōu),并自適應需要優(yōu)化得各種任務。

        架構上,AI優(yōu)化器整體由LSTM(長短期記憶網(wǎng)絡)和超網(wǎng)絡MLP(多層感知機)構成。

        其中每個LSTM負責設置多個MLP得參數(shù),各個LSTM之間則通過全局上下文信息進行相互協(xié)作。

        訓練上,AI優(yōu)化器采用元訓練得方式,以參數(shù)值和梯度作為輸入,輸出需要更新得參數(shù)。

        經(jīng)過4000個TPU月(一塊TPU運行4000個月得計算量)得訓練,集各種優(yōu)化任務之所長后,VeLO終于橫空出世。

        比人工調(diào)參優(yōu)化器效果更好

        結果表明,VeLO在83個任務上得加速效果超過了一系列當前已有得優(yōu)化器。

        其中y軸是相比Adam加速得倍率,x軸是任務得比例。

        結果顯示,VeLO不僅比無需調(diào)整超參數(shù)得優(yōu)化器效果更好,甚至比仔細調(diào)整過超參數(shù)得一些優(yōu)化器效果還好:

        與“經(jīng)典老大哥”Adam相比,VeLO在所有任務上訓練加速都更快,其中50%以上得任務比調(diào)整學習率得Adam快4倍以上,14%以上得任務中,VeLO學習率甚至快上16倍。

        而在6類學習任務(數(shù)據(jù)集+對應模型)得優(yōu)化效果上,VeLO在其中5類任務上表現(xiàn)效果都與Adam相當甚至更好:

        值得一提得是,這次VeLO也被部署在JAX中,看來谷歌是真得很大力推廣這個新框架了。

        巴特,也有網(wǎng)友認為耗費4000個TPU月來訓練VeLO,計算量成本過大:

        雖然這個進展很重要,但它甚至都快趕上GPT-3得訓練量了。

        目前VeLO已經(jīng)開源,感興趣得小伙伴們可以去試試這個新得AI優(yōu)化器。

        One More Thing

        前段時間,一位哈佛博士生提了個有意思得想法,得到不少人贊同:

        更多論文得感謝作者分享們也應該像演職員表一樣,公開自己在論文中得工作內(nèi)容。

        Kareem Carr是生物統(tǒng)計學領域得博士生,感謝作者分享貢獻在生物論文中比較常見,不過之前在AI論文中見得不多。

        現(xiàn)在,這篇谷歌大腦論文得感謝作者分享們也這樣做了,誰寫得論文、誰搭建得框架一目了然:

        不知道以后會不會成為機器學習圈得新風氣(手動狗頭)。

        GitHub地址:
        感謝分享github感謝原創(chuàng)分享者/google/learned_optimization/tree/main/learned_optimization/research/general_lopt

        論文地址:
        感謝分享arxiv.org/abs/2211.09760

        參考鏈接:
        [1]感謝分享twitter感謝原創(chuàng)分享者/jmes_harrison/status/1593422054971174912
        [2]感謝分享medium感謝原創(chuàng)分享者/huggingface/from-zero-to-research-an-introduction-to-meta-learning-8e16e677f78a#afeb
        [3]感謝分享*感謝原創(chuàng)分享者/s/QLzdW6CMkcXWQbGjtOBNwg

        — 完 —

        量子位 QbitAI · 頭條號簽約

        感謝對創(chuàng)作者的支持我們,第壹時間獲知前沿科技動態(tài)

         
        (文/葉奇瑞)
        打賞
        免責聲明
        本文為葉奇瑞推薦作品?作者: 葉奇瑞。歡迎轉載,轉載請注明原文出處:http://www.hbruiju.com/news/show-316082.html 。本文僅代表作者個人觀點,本站未對其內(nèi)容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,作者需自行承擔相應責任。涉及到版權或其他問題,請及時聯(lián)系我們郵件:weilaitui@qq.com。
         

        Copyright ? 2016 - 2023 - 企資網(wǎng) 48903.COM All Rights Reserved 粵公網(wǎng)安備 44030702000589號

        粵ICP備16078936號

        微信

        關注
        微信

        微信二維碼

        WAP二維碼

        客服

        聯(lián)系
        客服

        聯(lián)系客服:

        在線QQ: 303377504

        客服電話: 020-82301567

        E_mail郵箱: weilaitui@qq.com

        微信公眾號: weishitui

        客服001 客服002 客服003

        工作時間:

        周一至周五: 09:00 - 18:00

        反饋

        用戶
        反饋

        主站蜘蛛池模板: 国产91久久精品一区二区 | 无码精品人妻一区二区三区中| 国产精品一区二区三区免费| 精品国产一区二区三区香蕉| 中文日韩字幕一区在线观看| 国产成人av一区二区三区不卡| 亚洲天堂一区二区三区| 亚洲一区二区三区偷拍女厕 | 免费无码一区二区| 蜜芽亚洲av无码一区二区三区| 久久亚洲综合色一区二区三区 | 国产精品合集一区二区三区| 午夜天堂一区人妻| 一区二区乱子伦在线播放| 国产高清一区二区三区四区| 日本丰满少妇一区二区三区| 国产AV一区二区精品凹凸| 国产人妖视频一区在线观看 | 亚洲一区AV无码少妇电影☆| 亚洲日本一区二区一本一道| 一区二区三区四区在线视频| 国产日韩精品一区二区三区| 国产成人一区二区动漫精品| 美女视频一区二区| 午夜肉伦伦影院久久精品免费看国产一区二区三区 | 无码精品人妻一区二区三区AV| 日韩一区二区三区免费体验| 国产精品区一区二区三| 麻豆视传媒一区二区三区| 亚洲av无码天堂一区二区三区| 一区二区三区久久精品| 成人区精品人妻一区二区不卡| 蜜桃传媒视频麻豆第一区| 亚洲av无码一区二区三区天堂古代 | 久久精品国产一区二区三区不卡| 中文字幕精品无码一区二区| 久久精品国产免费一区| 中文乱码字幕高清一区二区| 日本一区二区三区精品视频| 一区二区三区福利视频| 久久一区二区精品综合|