Skip to content

Latest commit

 

History

History
263 lines (186 loc) · 25.4 KB

File metadata and controls

263 lines (186 loc) · 25.4 KB

初学者数据科学课程

Open in GitHub Codespaces

GitHub license GitHub contributors GitHub issues GitHub pull-requests PRs Welcome

GitHub watchers GitHub forks GitHub stars

Microsoft Foundry Discord

Microsoft Foundry Developer Forum

微软 Azure 云推广团队很高兴推出一个为期 10 周、共 20 课的完整数据科学课程。每节课包含课前和课后测验、完成课程的书面说明、解决方案以及作业。我们的项目驱动教学法让你在构建项目的过程中学习,这是帮助新技能“落地”的有效方法。

衷心感谢我们的作者: Jasmine Greenaway, Dmitry Soshnikov, Nitya Narasimhan, Jalen McGee, Jen Looper, Maud Levy, Tiffany Souterre, Christopher Harrison

🙏 特别感谢 🙏 我们的 Microsoft 学生大使作者、审稿人及内容贡献者, 尤其是 Aaryan Arora、Aditya GargAlondra SanchezAnkita SinghAnupam MishraArpita Das、ChhailBihari Dubey、Dibri NsoforDishita BhasinMajd SafiMax BlumMiguel CorreaMohamma Iftekher (Iftu) Ebne JalalNawrin TabassumRaymond Wangsa PutraRohit Yadav、Samridhi Sharma、Sanya Sinha, Sheena NarulaTauqeer Ahmad、Yogendrasingh Pawar 、Vidushi GuptaJasleen Sondhi

Sketchnote by @sketchthedocs https://sketchthedocs.dev
初学者数据科学 - 手绘笔记由 @nitya

🌐 多语言支持

通过 GitHub Action 支持(自动且持续更新)

Arabic | Bengali | Bulgarian | Burmese (Myanmar) | Chinese (Simplified) | Chinese (Traditional, Hong Kong) | Chinese (Traditional, Macau) | Chinese (Traditional, Taiwan) | Croatian | Czech | Danish | Dutch | Estonian | Finnish | French | German | Greek | Hebrew | Hindi | Hungarian | Indonesian | Italian | Japanese | Kannada | Khmer | Korean | Lithuanian | Malay | Malayalam | Marathi | Nepali | Nigerian Pidgin | Norwegian | Persian (Farsi) | Polish | Portuguese (Brazil) | Portuguese (Portugal) | Punjabi (Gurmukhi) | Romanian | Russian | Serbian (Cyrillic) | Slovak | Slovenian | Spanish | Swahili | Swedish | Tagalog (Filipino) | Tamil | Telugu | Thai | Turkish | Ukrainian | Urdu | Vietnamese

想要本地克隆?

本库包含超过 50 种语言的翻译,显著增加了下载大小。若想不包含翻译文件可使用稀疏检出:

Bash / macOS / Linux:

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone '/*' '!translations' '!translated_images'

CMD (Windows):

git clone --filter=blob:none --sparse https://github.com/microsoft/Data-Science-For-Beginners.git
cd Data-Science-For-Beginners
git sparse-checkout set --no-cone "/*" "!translations" "!translated_images"

这样你可以更快下载,获得完成课程所需的全部内容。

如需支持更多语言,查看此处支持列表:here

加入我们的社区

Microsoft Foundry Discord

我们正在举办 Discord 上的“与 AI 一起学习”系列,时间为 2025 年 9 月 18 日至 30 日。了解详情并加入请见与 AI 一起学习系列。你将获得使用 GitHub Copilot 进行数据科学的技巧和窍门。

Learn with AI series

你是学生吗?

请使用以下资源开始:

  • 学生中心页面 在此页面你能找到初学者资源、学生包甚至获得免费认证券的方式。我们会至少每月更新内容,建议收藏并定期查看。
  • Microsoft Learn 学生大使 加入全球学生大使社区,这可能是你进入微软的机会。

入门指南

📚 文档

👨‍🎓 学生专区

完全零基础:数据科学新人?请先看我们的初学者示例!这些简单且注释详尽的示例能帮助你了解基础知识,再深入全套课程。 学生:若想自行使用本课程,请 fork 整个仓库并独立完成练习,从课前测验开始。阅读课程内容并完成剩余活动。尽量理解课程后自行构建项目,而非直接复制解决方案代码;不过每个项目导向课程的 /solutions 文件夹都有参考代码。你也可以和朋友组建学习小组一起学习。想深入学习,推荐访问 Microsoft Learn

快速开始:

  1. 查看安装指南,配置环境
  2. 研读使用指导,了解课程操作流程
  3. 从第一课开始,按顺序学习
  4. 加入我们的Discord 社区获得支持

👩‍🏫 教师专区

教师们:我们提供了一些建议来帮助您使用本课程。我们非常期待您在讨论论坛中的反馈!

团队介绍

宣传视频

动图作者 Mohit Jaisal

🎥 点击上方图片观看项目和创作者介绍视频!

教学法

我们在构建本课程时选择了两个教学原则:确保课程以项目为基础,并且包含频繁的测验。在本系列课程结束时,学生将掌握数据科学的基本原理,包括伦理概念、数据准备、处理数据的不同方法、数据可视化、数据分析、数据科学的实际应用案例等等。

此外,课前的低风险测验可以帮助学生确立学习主题的意向,而课后的第二次测验则有助于进一步巩固知识。本课程设计灵活且有趣,可整体学习也可部分学习。项目从简单开始,随着10周周期的推进逐渐变得复杂。

查看我们的行为准则贡献指南翻译指南。欢迎您提供建设性的反馈!

每节课包括:

  • 可选的草图笔记
  • 可选的补充视频
  • 课前热身测验
  • 书面课程内容
  • 针对项目型课程的逐步项目构建指导
  • 知识检查
  • 挑战任务
  • 补充阅读
  • 作业
  • 课后测验

关于测验的说明:所有测验都包含在 Quiz-App 文件夹中,共40个测验,每个测验包含3个问题。它们在课程中有链接,但测验应用可在本地运行或部署到 Azure;请按照 quiz-app 文件夹中的说明操作。测验正在逐步实现本地化。

🎓 适合初学者的示例

刚开始学数据科学? 我们创建了一个专门的示例目录,其中包含简单且注释详细的代码,帮助您入门:

  • 🌟 Hello World - 你的第一个数据科学程序
  • 📂 加载数据 - 学习读取和探索数据集
  • 📊 简单分析 - 计算统计数据并发现模式
  • 📈 基础可视化 - 创建图表和曲线图
  • 🔬 真实项目 - 从头到尾完成完整工作流程

每个示例都包含详细注释,解释每一步骤,非常适合绝对初学者!

👉 从示例开始 👈

课程列表

 由 @sketchthedocs https://sketchthedocs.dev 制作的草图笔记
数据科学初学者路线图 - 草图笔记作者 @nitya
课程编号 主题 课程分组 学习目标 相关课程 作者
01 定义数据科学 介绍 了解数据科学的基本概念及其与人工智能、机器学习和大数据的关系。 课程 视频 Dmitry
02 数据科学伦理 介绍 数据伦理的概念、挑战及框架。 课程 Nitya
03 定义数据 介绍 数据的分类及常见来源。 课程 Jasmine
04 统计学和概率入门 介绍 运用概率与统计的数学方法理解数据。 课程 视频 Dmitry
05 使用关系型数据 数据操作 介绍关系型数据,及使用结构化查询语言(SQL,发音为“see-quell”)进行数据探索和分析的基础知识。 课程 Christopher
06 使用 NoSQL 数据 数据操作 介绍非关系型数据及其不同类型,以及对文档数据库进行探索和分析的基础知识。 课程 Jasmine
07 使用 Python 数据操作 使用 Python 和 Pandas 等库进行数据探索的基础。建议具备 Python 编程基础。 课程 视频 Dmitry
08 数据准备 数据操作 数据清洗和转换技术,处理缺失、不准确或不完整数据的挑战。 课程 Jasmine
09 数量可视化 数据可视化 学习如何用 Matplotlib 可视化鸟类数据 🦆 课程 Jen
10 数据分布可视化 数据可视化 可视化区间内的观察值和趋势。 课程 Jen
11 比例可视化 数据可视化 可视化离散及分组百分比数据。 课程 Jen
12 关系可视化 数据可视化 可视化数据集及其变量之间的联系和相关性。 课程 Jen
13 有意义的可视化 数据可视化 制作有价值的可视化,帮助有效地解决问题和获得洞察的技巧与指导。 课程 Jen
14 数据科学生命周期简介 生命周期 介绍数据科学生命周期及其第一步——获取和提取数据。 课程 Jasmine
15 分析 生命周期 关注数据科学生命周期中分析数据的技术。 课程 Jasmine
16 交流 生命周期 关注数据科学生命周期中以便于决策者理解的方式呈现数据洞察的阶段。 课程 Jalen
17 云端数据科学 云端数据 本系列课程介绍云端数据科学及其优势。 课程 TiffanyMaud
18 云端数据科学 云端数据 使用低代码工具训练模型。 课程 TiffanyMaud
19 云端数据科学 云端数据 使用 Azure Machine Learning Studio 部署模型。 课程 TiffanyMaud
20 实际应用中的数据科学 实践 数据科学驱动的真实世界项目。 课程 Nitya

GitHub Codespaces

按照以下步骤在 Codespace 中打开此示例:

  1. 点击 Code 下拉菜单,选择 “Open with Codespaces” 选项。
  2. 在面板底部选择 “+ New codespace”。 更多信息请查看GitHub 文档

VSCode Remote - 容器

按以下步骤使用您的本地计算机和 VSCode 通过 VS Code Remote - Containers 扩展在容器中打开此仓库:

  1. 如果这是您首次使用开发容器,请确保您的系统满足前置要求(例如已安装 Docker),详情见快速入门文档

使用此仓库,您可以选择在隔离的 Docker 卷中打开仓库:

注意:此操作实际上会使用 Remote-Containers 的 Clone Repository in Container Volume... 命令,将源码克隆到 Docker 卷中而非本地文件系统。 是持久化容器数据的推荐机制。

或者打开本地克隆或下载的仓库版本:

  • 将仓库克隆到本地文件系统。
  • 按 F1 并选择 Remote-Containers: Open Folder in Container... 命令。
  • 选择克隆的文件夹,等待容器启动,然后开始使用。

离线访问

您可以使用 Docsify 离线运行文档。先 Fork 此仓库,安装 Docsify 到本地,然后在仓库根目录输入 docsify serve。网站将通过本地端口 3000 提供服务:localhost:3000

注意,笔记本文件不会通过 Docsify 渲染,因此需要运行笔记本时,请单独在 VS Code 中使用 Python 内核运行。

其它课程

我们的团队还制作了其他课程!敬请查看:

LangChain

LangChain4j for Beginners LangChain.js 初学者 LangChain 初学者

Azure / Edge / MCP / 代理

AZD 初学者 Edge AI 初学者 MCP 初学者 AI 代理 初学者


生成式 AI 系列

生成式 AI 初学者 生成式 AI (.NET) 生成式 AI (Java) 生成式 AI (JavaScript)


核心学习

机器学习 初学者 数据科学 初学者 人工智能 初学者 网络安全 初学者 网页开发 初学者 物联网 初学者 XR 开发 初学者


Copilot 系列

AI 结对编程 Copilot C#/.NET Copilot Copilot 冒险

获取帮助

遇到问题? 请查阅我们的故障排除指南,获取常见问题的解决方案。

如果您遇到困难或对构建 AI 应用有任何疑问,请加入其他学习者和经验丰富的开发者一起讨论 MCP。这是一个支持性的社区,欢迎提问且知识自由共享。

Microsoft Foundry Discord

如果您在构建过程中有产品反馈或遇到错误,请访问:

Microsoft Foundry 开发者论坛


免责声明
本文档通过 AI 翻译服务 Co-op Translator 进行翻译。虽然我们力求准确,但请注意自动翻译可能包含错误或不准确之处。应以原始语言版本的文档为权威来源。对于重要信息,建议使用专业人工翻译。我们不对因使用本翻译而产生的任何误解或误释承担责任。