ADVERTISEMENT
【6/13 開課】DeepMind首席研究員曾說:「人工智慧 = 深度學習 + 強化學習」,強化學習的重要不言而喻,其核心訓練方式就是透過Trial & Error,進而打造通用性的框架,用以解決許多不同領域的問題。講師循序漸進的三步驟帶你深入瞭解強化學習:從基本觀念解說、強化學習核心演算法到深度強化學習的主流演算法,精湛解說讓你一天課程收穫滿滿。
6個理由,為什麼要來上課?
- 強化學習是催生 AlphaCraft、 AlphaGo 的技術。
- 強化學習核心概念具有共通性,可以衍伸到各種領域應用。
- 自主產生學習資訊,不需要借助大量經驗數據。
- 搭配深度學習使用,增強處理問題的能力實現自主學習。
- 講師 Jerry 是 Google 認證的機器學習開發專家(GDE),品質保證。
- 認識講師,遇到困難有人回答;書本資料太多、網路上的資料太分散,現場有人教學得快。
>>>早鳥限時優惠價 3,600 元<<<
【課程內容】
1. 強化學習概論
- 馬可夫決策過程 (Markov decision process)
- 價值函數(Value Functions)
- 貝爾曼方程 (Bellman Equations)
2. 深入強化學習
ADVERTISEMENT
- 動態規劃法(Dynamic Programming)
- 蒙地卡羅方法(Monte Carlo Methods)
- 時間差分學習法(Temporal-Difference Learning)
3. 深度強化學習主流演算法
- Deep Q-Learning
- DQN
- DDQN
- Dueling DQN
- DRQN
- Advantage Actor Critic(A2C)
【課程資訊】
時間:2020/6/13(六) 早上 09:30~下午 16:30 ,午休 1 小時
費用:
ADVERTISEMENT
早鳥限時優惠 3,600 元。
原價 4,000 元。
地點:T客邦總部,台北市中山區民生東路二段141號6F (Google 地圖)
ADVERTISEMENT
【注意事項】
- 請學員自備筆電,教室提供電源插座。
- 建議具備 Python 程式語言基礎為佳。
- 課程學員皆附當日午餐。
主辦單位:
ADVERTISEMENT
【報名方式】
早鳥限時優惠價 3,600 元
Step2:直接在課程頁面報名並繳費。提供線上刷卡、ATM轉帳、超商代碼三種繳費方式。付款後約20分鐘即可自行查詢繳費結果。
強化學習(Reinforcement Learning)
強化學習的核心思想就是 Trail & Error,其中包含四大元素:
- 策略(Policy):環境的感知狀態到行動的映射方式。
- 反饋(Reward):環境對智能體行動的反饋。
- 價值函數(Value Function):評估狀態的價值函數,狀態的價值即從當前狀態開始,期望在未來獲得的獎賞。
- 環境模型(Model):模擬環境的行為。
強化學習與其他機器學習的不同:
- 強化學習更加專註於在線規劃,需要在探索和採用之間找到平衡。
- 強化學習不需要監督者,只需要獲取環境的反饋。
- 反饋是延遲的,不是立即生成的。
- 時間在強化學習中很重要,其數據為序列數據,並不滿足獨立同分布假設。
內容轉載自:https://www.itread01.com/content/1540645094.html
上課講師:吳柏翰(Jerry)
JerryWu現任Google機器學習開發專家(GDE)、亞太智能機器創辦人兼技術長,專注於機器智能(Machine Intelligence)的研發與整合,包含機器視覺(CV)與自然語言理解(NLU)。曾任國立台灣科技大學講師、外商數據科學顧問、裕隆集團/華創車電(股)資深數據科學顧問、DSP智庫驅動(股)共同創辦人兼技術長,歷經許多產、官、學、研機器智能專案。
TVBS採訪:【APMIC亞太智能機器】以機器智能和語意理解受訪TVBS世界翻轉中
早鳥限時優惠價 3,600 元
【注意事項】
- T客邦(以下稱主辦單位)保有修改活動內容之權力。
- 取消活動請打電話或寫 E-Mail 給客服人員或承辦人員,做為提出取消要求的表示。已繳費者若有事無法參加活動,活動舉辦當天0點0分以後提出取消要求者不退費,活動前一天 23:59:59 以前提出取消要求,酌收已付款項之10%做為行政處理費。
- 本活動以完成付款認定取得報名資格。參加者在課程頁面報名並繳費,若超過48小時付款期限,會將名額讓給其他候補參加者。
- 為提供訂購、行銷、客戶管理或其他合於營業登記項目或章程所定業務需要之目的,家庭傳媒集團(即英屬蓋曼群島商家庭傳媒股份有限公司城邦分公司、城邦事業股份有限公司、書虫股份有限公司、墨刻出版股份有限公司、城邦原創股份有限公司),於本集團之營運期間及地區內,將以 mail、傳真、電話、簡訊、郵寄或其他公告方式利用您提供之資料(資料類別:C001、C002、C003、C011等)。利用對象除本集團外,亦可能包括相關服務的協力機構。如您有依個資法第三條或其他需服務之處,得致電本公司客服中心電話 0800-020-299 請求協助。相關資料如為非必填項目,不提供亦不影響您的權益。
- 有任何關於此活動文章上的問題歡迎致電洽詢(02)2518-1133#3464。
ADVERTISEMENT