Skip to content

Latest commit

 

History

History
158 lines (145 loc) · 12.7 KB

GenerativeAI_Notes.md

File metadata and controls

158 lines (145 loc) · 12.7 KB

前言

快速筆記一下上課內容,以利日後Ctrl+F搜尋keywords和concept

2024.02.24 【生成式AI導論 2024】第1講:生成式AI是什麼?

  • video: https://www.youtube.com/watch?v=JGtqpQXfJis
  • slide: https://speech.ee.ntu.edu.tw/~hylee/genai/2024-spring-course-data/0223/0223_intro_gai.pdf
  • 生成式人工智慧 ⊂ 人工智慧
    • 人工智慧 (Artificial Intelligence, AI): 讓機器展現「智慧」
    • 生成式人工智慧 (Generative AI, GenAI): 機器產生 複雜 有結構 的物件
      • 文章-由文字所構成 i.g. ChatGPT 用 Transformer
      • 影像-由像素所組成 i.g. Stable Diffusion, Midjourney, DALL·E 用 Diffusion Model
  • 生成式人工智慧 ⊂ 深度學習 ⊂ 機器學習 ⊂ 人工智慧
    • 機器學習 (Machine Learning) ≈ 機器自動從資料找一個函式
      • i.g. 函式 𝑦 = 𝑓(𝑥) = 𝑎𝑥 + 𝑏, a和b 為 參數 (Parameter)
      • i.g. 機器學習可以把有上萬個參數的函式的參數找出來 透過 訓練, training (學習, learning)
      • i.g. 有了函式後計算答案叫 測試, testing (推論, inference)
    • 深度學習(Deep Learning) 是一種機器學習技術, 使用 類神經網路 (Neural Network)
  • 生成策略: 文字接龍 => 複雜的物件 拆解成較小的單位 依照某種固定的順序依序生成 => Autoregressive Generation
    • 機器需要能夠產生在訓練時從來沒有看過的東西
    • 原本生文章 可能性 窮盡無盡! => 拆解成一連串 接龍 為分類問題 答案有限!

2024.03.03 【生成式AI導論 2024】第2講:今日的生成式人工智慧厲害在哪裡?從「工具」變為「工具人」

  • video: https://www.youtube.com/watch?v=glBhOQ1_RkE
  • slide: https://drive.google.com/file/d/1Ru6DUX8KrSzCvn2DN1-YluTyx5rw3QD3/view
  • 今日的生成式人工智慧厲害在哪裡? 功能單一 -> 沒有特定功能(通用型)
    • GPT系列 為OpenAI所開發
    • Gemini 為Google所開發
    • Llama系列 為Meta釋出的開源大型語言模型
    • TAIDE模型為Llama2模型結合臺灣文化與正體中文語料之衍生模型 (來自國科會-推動可信任生成式AI發展先期計畫)
  • 可能的研究方向:
    • 評估模型(evaluation)困難 不好評估答案之於問題是否完美被解決
    • 要防止說出有害內容 AI倫理
    • 優化:
      • A1.改變自己來強化模型 (improving inputs) - prompt engineering, continue
      • A2.訓練自己的模型 (improving parameters) continue
        • A2.1.自我學習,累積實力 (Self-supervised Learning) continue
        • A2.2.名師指點,發揮潛力 (Instruction Fine-tuning) continue
        • A2.3.參與實戰,打磨技巧 (Reinforcement Learning from Human Feedback (RLHF)) continue

2024.03.03【生成式AI導論 2024】第3講:訓練不了人工智慧?你可以訓練你自己 (上) — 神奇咒語與提供更多資訊

A1.改變自己來強化模型 (improving inputs) - prompt engineering

A1.1.神奇咒語 (不一定對所有模型、所有任務都適用)

  • 叫模型思考 "Chain of Thought (CoT)"
  • 叫模型解釋一下自己的答案 Reasoning
  • 情緒勒索 Emotional Stimuli
  • 更多的神奇咒語 驗證都市傳說
    • i.g. 有禮貌是沒用的 No need to be polite like “please”, “if you don’t mind”, “thank you”, “I would like to”, etc.,
    • i.g. 正面表述 好過負面表述 Employ affirmative directives such as ‘do,’ while steering clear of negative language like ‘don’t’.
    • i.g. 說要給小費 是有用的 Add “I’m going to tip $xxx for a better solution!”
    • i.g. 說會有處罰 是有用的 Incorporate the following phrases: “You will be penalized”
    • i.g. 要其中立無偏見 是有用的 Add prompt “Ensure that your answer is unbiased and avoids relying on stereotypes.”
    • Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4, https://arxiv.org/abs/2312.16171
  • 用 增強式學習 (Reinforcement Learning, RL) 找神奇咒語
    • i.g. 任務目標:回應越長越好, prompt: “ways ways ways ways ways ways ways .......”
    • Learning to Generate Prompts for Dialogue Generation through Reinforcement Learning, https://arxiv.org/abs/2206.03931
  • 用 大型語言模型 找神奇咒語
    • i.g. Let’s work this out in a step by step way to be sure we have the right answer.
    • i.g. Take a deep breath and work on this problem step-by-step
    • Large Language Models Are Human-Level Prompt Engineers, https://arxiv.org/abs/2211.01910

A1.2.提供更多資訊

2024.03.10【生成式AI導論 2024】第4講:訓練不了人工智慧?你可以訓練你自己 (中) — 拆解問題與使用工具

A1.3.拆解任務

  • 複雜的任務拆成多個步驟
    • e.g. 大綱分段寫長篇小說 Re3: Generating Longer Stories With Recursive Reprompting and Revision https://arxiv.org/abs/2210.06774
    • e.g. 算數學有列式 that's why Chain of Thought (CoT) works
  • 多一個讓模型檢查自己錯誤的步驟
  • 同一個問題問多次 再整合
    • 為什麼同一個問題每次答案都不同? => 輸出是機率分佈 每個字都有可能出現
    • Self-Consistency Improves Chain of Thought Reasoning in Language Models https://arxiv.org/abs/2203.11171
  • 綜合使用:

A1.4.使用工具

  • 使用搜尋引擎(得到額外的資訊)
    • Retrieval Augmented Generation (RAG)
  • 寫程式(並執行)
  • 使用文字生圖AI
    • ChatGPT4+DALL-E
  • 結合使用:
    • ChatGPT4 and its plugins
  • 原理:在適當時機產生特殊符號 繼續文字接龍 => 但也可能會干擾原本對的答案變錯

2024.03.24【生成式AI導論 2024】第5講:訓練不了人工智慧?你可以訓練你自己 (下) — 讓語言彼此合作,把一個人活成一個團隊

A1.5.模型合作

  • 讓 適合的模型 做適合的事 殺機焉用牛刀
  • 讓模型們 彼此討論 彼此反省
    • i.g. 討論 比自己推翻自己容易
    • i.g. 越多agent越好 越多討論次數越好
    • i.g. 不同的任務 用 不同的討論方式 不同權限 => 不同任務最合適的討論方式是不一樣的
  • 討論的共識 由裁判模型決定
  • 總成一個團隊

2024.03.24【生成式AI導論 2024】第6講:大型語言模型修練史 — 第一階段: 自我學習,累積實力

A2.訓練自己的模型 (improving parameters)

A2.1.自我學習,累積實力 (Self-supervised Learning)

2024.03.25【生成式AI導論 2024】第7講:大型語言模型修練史 — 第二階段: 名師指點,發揮潛力

A2.2.名師指點,發揮潛力 (Instruction Fine-tuning)

2024.04.12【生成式AI導論 2024】第8講:大型語言模型修練史 — 第三階段: 參與實戰,打磨技巧

A2.3.參與實戰,打磨技巧 (Reinforcement Learning from Human Feedback (RLHF))

2024.04.20【生成式AI導論 2024】第9講:以大型語言模型打造的AI Agent