Skip to content

Latest commit

 

History

History
263 lines (186 loc) · 25.5 KB

File metadata and controls

263 lines (186 loc) · 25.5 KB

初學者的資料科學課程大綱

Open in GitHub Codespaces

GitHub license GitHub contributors GitHub issues GitHub pull-requests PRs Welcome

GitHub watchers GitHub forks GitHub stars

Microsoft Foundry Discord

Microsoft Foundry Developer Forum

微軟 Azure 雲端推廣者很高興提供一個為期 10 週、共 20 節課的資料科學課程。每個課程包含課前與課後測驗、完成授課內容的書面指導、解答以及作業。我們以專案為導向的教學法讓你在實作中學習,這是讓新技能穩固成形的有效方式。

衷心感謝我們的作者: Jasmine GreenawayDmitry SoshnikovNitya NarasimhanJalen McGeeJen LooperMaud LevyTiffany SouterreChristopher Harrison

🙏 特別感謝 🙏 我們的 Microsoft 學生大使 作者、審閱者與內容貢獻者, 特別是 Aaryan Arora、Aditya GargAlondra SanchezAnkita SinghAnupam MishraArpita Das、ChhailBihari Dubey、Dibri NsoforDishita BhasinMajd SafiMax BlumMiguel CorreaMohamma Iftekher (Iftu) Ebne JalalNawrin TabassumRaymond Wangsa PutraRohit Yadav、Samridhi Sharma、Sanya SinhaSheena NarulaTauqeer Ahmad、Yogendrasingh Pawar 、Vidushi GuptaJasleen Sondhi

Sketchnote by @sketchthedocs https://sketchthedocs.dev
初學者資料科學 — 速寫筆記由 @nitya 製作

🌐 多語言支援

透過 GitHub Action 支援(自動且持續更新)

Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Khmer | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese

偏好本地複製?

本存放庫包含超過 50 種語言翻譯,會大幅增加下載大小。如欲不含翻譯內容之複製,請使用稀疏結帳:

Bash / macOS / Linux:

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'

CMD (Windows):

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"

這樣能讓您快速下載完成課程所需內容。

若您希望支援更多翻譯語言,請參考此處

加入我們的社群

Microsoft Foundry Discord

我們正在舉辦 Discord AI 學習系列活動,了解更多並於 2025 年 9 月 18 日至 30 日加入我們:Learn with AI Series。您將獲得使用 GitHub Copilot 進行資料科學的技巧與秘訣。

Learn with AI series

你是學生嗎?

請從以下資源開始:

  • 學生中心頁面 這個頁面包含初學者資源、學生套件,甚至還有獲取免費認證憑證券的方式。這是您想要加入書籤並定期查看的頁面,我們會每月至少更新一次內容。
  • Microsoft Learn 學生大使 加入全球學生大使社群,這或許是您進入微軟的途徑。

開始入門

📚 文件說明

👨‍🎓 給學生

完全初學者:剛接觸資料科學?請先試試我們的入門友善範例!這些簡單且有詳盡註解的範例將幫助您理解基礎,再深入完整課程。 學生專區:欲自行使用本課程,請 fork 整個存放庫並自我完成練習,從課前測驗開始。接著閱讀授課內容並完成其餘活動。建議試著根據學到的知識自行完成專案,而非直接複製解答程式碼;不過每個以專案為導向的課程中,/solutions 目錄裡仍提供程式碼可供參考。另一想法是組成讀書會與朋友一同學習。更多進階學習建議參考 Microsoft Learn

快速入門:

  1. 查看 安裝指南 以設置您的環境
  2. 閱讀 使用指南 了解如何使用課程內容
  3. 從第 1 課開始,按順序完成
  4. 加入我們的 Discord 社群 獲得支援

👩‍🏫 教師專區

教師們:我們已經包含了一些建議來幫助您使用這套課程。非常歡迎您在我們的討論區提供您的反饋!

認識團隊

宣傳影片

動畫 GIF 製作者 Mohit Jaisal

🎥 點擊上方圖片,觀看關於此專案與創建團隊的影片!

教學法

我們在設計這套課程時,選擇了兩個教學原則:確保課程以專案為基礎並且包含頻繁的測驗。透過這系列課程結束後,學生將學會資料科學的基本原理,包括倫理概念、資料準備、不同的資料處理方式、資料視覺化、資料分析、資料科學的實務案例等等。

此外,課前的低壓測驗設定學生學習某主題的意向,而課後的第二次測驗則有助於加強記憶。此課程設計靈活且有趣,學生可以全程修習或選擇部份學習。專案由淺入深,整個 10 週學期結束時會越來越複雜。

請參考我們的行為準則貢獻指南翻譯指南。誠摯歡迎您的建設性意見!

每堂課包含:

  • 選修手繪筆記
  • 選修補充影片
  • 課前熱身測驗
  • 書面課程內容
  • 對於專案型課程,提供逐步建立專案的指引
  • 知識檢核
  • 挑戰任務
  • 補充閱讀材料
  • 作業
  • 課後測驗

關於測驗的說明:所有測驗皆集中在 Quiz-App 資料夾中,共包含 40 個,每個測驗有三個問題。這些測驗會從課程中鏈結取得,但您也可以在本地端執行測驗應用,或部署至 Azure,請遵循 quiz-app 資料夾中的指示。測驗也逐步進行在地化。

🎓 適合新手的範例

剛接觸資料科學嗎? 我們建立了一個特別的範例目錄,提供簡單且註解詳盡的程式碼,幫助您開始學習:

  • 🌟 Hello World - 您的第一個資料科學程式
  • 📂 讀取資料 - 學習如何讀取及探索資料集
  • 📊 簡單分析 - 計算統計數據並發現模式
  • 📈 基礎視覺化 - 建立圖表與折線圖
  • 🔬 真實專案 - 完整的工作流程範例

每個範例都包含詳細註解,解釋每一個步驟,非常適合初學者!

👉 從範例開始 👈

課程列表

 由 @sketchthedocs 製作的手繪筆記 https://sketchthedocs.dev
初學者資料科學:學習路線圖 - 手繪筆記作者 @nitya
課程號碼 主題 課程組別 學習目標 關聯課程 作者
01 定義資料科學 介紹 理解資料科學的基本概念,以及它與人工智慧、機器學習和大數據的關係。 課程 影片 Dmitry
02 資料科學倫理 介紹 資料倫理的概念、挑戰與架構。 課程 Nitya
03 定義資料 介紹 資料的分類與常見來源。 課程 Jasmine
04 統計學與機率入門 介紹 利用機率與統計的數學技術來了解資料。 課程 影片 Dmitry
05 操作關聯資料 資料操作 關聯資料介紹,與使用結構化查詢語言(SQL,讀作「see-quell」)探索和分析關聯資料基礎。 課程 Christopher
06 操作 NoSQL 資料 資料操作 非關聯資料介紹,及其多種型態與使用文件資料庫進行探索及分析基礎。 課程 Jasmine
07 使用 Python 資料操作 使用 Python 及 Pandas 等函式庫進行資料探索的基礎。建議有 Python 程式設計的基礎。 課程 影片 Dmitry
08 資料準備 資料操作 清理與轉換資料的技術,解決缺失、錯誤或不完整資料的挑戰。 課程 Jasmine
09 量的視覺化 資料視覺化 使用 Matplotlib 來視覺化鳥類資料 🦆 課程 Jen
10 資料分布的視覺化 資料視覺化 在區間內視覺化觀察值與趨勢。 課程 Jen
11 比例的視覺化 資料視覺化 視覺化離散和分組百分比。 課程 Jen
12 關係的視覺化 資料視覺化 視覺化資料集及其變數之間的連結和相關性。 課程 Jen
13 有意義的視覺化 資料視覺化 製作有效解決問題和洞察的視覺化技巧和指導。 課程 Jen
14 資料科學生命週期介紹 生命週期 介紹資料科學生命週期及其第一步驟——取得與萃取資料。 課程 Jasmine
15 分析 生命週期 著重於資料科學生命週期中分析資料的技巧。 課程 Jasmine
16 溝通 生命週期 著重於用讓決策者更容易理解的方式呈現資料洞察。 課程 Jalen
17 雲端資料科學 雲端資料 介紹雲端資料科學及其好處的一系列課程。 課程 TiffanyMaud
18 雲端資料科學 雲端資料 使用低程式碼工具訓練模型。 課程 TiffanyMaud
19 雲端資料科學 雲端資料 使用 Azure Machine Learning Studio 部署模型。 課程 TiffanyMaud
20 資料科學實務 實務應用 真實世界中資料科學驅動的專案。 課程 Nitya

GitHub Codespaces

請依下列步驟在 Codespace 中打開此範例:

  1. 點選 Code 下拉選單,選擇 Open with Codespaces 選項。
  2. 在窗格底部選擇 + New codespace。 更多資訊請參考GitHub 文件

VSCode Remote - Containers

請依下列步驟使用本機和 VSCode 與 VS Code Remote - Containers 擴充功能,於容器中開啟本儲存庫:

  1. 若您是第一次使用開發容器,請確認您系統符合先決條件(例如已安裝 Docker),可參考快速入門文件

使用此儲存庫,可以透過隔離的 Docker 容器卷打開儲存庫:

注意:底層會使用 Remote-Containers: Clone Repository in Container Volume... 指令,將原始碼克隆到 Docker 容器卷中,而非本機檔案系統。Volumes 是持久化容器資料的推薦方法。

或打開本機已克隆或下載的儲存庫版本:

  • 將此儲存庫克隆至本機檔案系統。
  • 按下 F1、選擇 Remote-Containers: Open Folder in Container... 指令。
  • 選擇克隆的資料夾,等待容器啟動,即可開始使用。

離線存取

您可以透過使用 Docsify 離線瀏覽本文件。請分叉此儲存庫,於本機安裝 Docsify,然後在此儲存庫根目錄執行 docsify serve。網站會在本地端 3000 埠口提供服務:localhost:3000

注意,Notebook 內容無法透過 Docsify 渲染,需另行在 VS Code 裡使用 Python 核心執行。

其他課程

我們團隊也推出其他課程!請參考:

LangChain

LangChain4j 入門 LangChain.js for Beginners LangChain for Beginners

Azure / Edge / MCP / Agents

AZD for Beginners Edge AI for Beginners MCP for Beginners AI Agents for Beginners


生成式 AI 系列

Generative AI for Beginners Generative AI (.NET) Generative AI (Java) Generative AI (JavaScript)


核心學習

ML for Beginners Data Science for Beginners AI for Beginners Cybersecurity for Beginners Web Dev for Beginners IoT for Beginners XR Development for Beginners


Copilot 系列

Copilot for AI Paired Programming Copilot for C#/.NET Copilot Adventure

獲取幫助

遇到問題? 請查看我們的疑難排解指南以尋找常見問題的解決方法。

如果您卡住了或者對建立 AI 應用程式有任何疑問,歡迎加入學習者及資深開發者的討論社群。這是一個支持彼此的社區,歡迎提問並自由分享知識。

Microsoft Foundry Discord

如果您在產品使用過程中有任何反饋或錯誤,請訪問:

Microsoft Foundry Developer Forum


免責聲明: 本文件由 AI 翻譯服務 Co-op Translator 進行翻譯。雖然我們力求準確,但請注意,自動翻譯可能包含錯誤或不準確之處。原始文件的母語版本應被視為權威來源。對於重要資訊,建議採用專業人工翻譯。我們不對因使用本翻譯所產生的任何誤解或誤譯負責。