单元3最终项目恭喜你!您已经通过另一个高级模块完成了学习,现在您可以炫耀自己新发现的机器学习技能了!模块3剩下的就是完成最终项目!该项目该项目的主要目标是创建分类模型。
对于此项目,您可以选择:从策划清单中选择一个数据集选择由成员之一带入小组的预先批准的数据集选择数据集之后,您将使用到目前为止所学到的有关数据科学和机器学习的所有知识来获取数据集,进行预处理和探索,然后构建并解释可以回答所选问题的分类模型。
数据集您可以选择以下描述的数据集之一。
每种方法都有其自身的优缺点,当然还有其自身相关的业务问题和利益相关者。
可能需要充实您对受众或业务主张的理解,而不是在此处概述。
如果您选择这三个数据集之一,则无需得到教师的进一步批准。

请注意,此链接还指向“和“。
建立分类器,以根据有关汽车,汽车中的人,路况等的信息来预测车祸的主要原因,您可以想象您的听众是一
2025/3/3 21:29:52 998KB JupyterNotebook
1
数据科学Final复习资料。
内含往年原题+近似题+最新押题。
为您节省时间,诚意十足资料宝贵,整理费时请多珍惜,仅供学习与交流!
2025/2/1 15:47:51 390KB 数据科学
1
GoPlus-数据科学的Go+语言注意:Go+仍在大力开发中。
请不要在生产环境中使用它。
关于Go+的摘要关于Go+的主要印象是什么?静态类型语言。
与完全兼容。
类似脚本的样式,并且比Go更具可读性的数据科学代码。
例如,以下是合法的Go+源代码:a:=[1,2,3.4]println(a)我们如何用Go语言做到这一点?packagemainfuncmain(){a:=[]float64{1,2,3.4}println(a)}当然,我们不仅要做少打字的事情。
例如,我们支持,这使数据处理更加容易。
a:=[1,3,5,7,11]b:=[x*xforx<-a,x>3]println(b)//output:[2549121]mapData:={"Hi":1,"Hello":2,"Go+":3}reversedMap:={v:kfork,v
2025/1/31 19:10:12 440KB go language golang data-science
1
资源包主要内容:(1)各个步骤需要的实验源码(2)各个步骤生成的text、xml以及csv文件(3)实验过程的大致说明,帮助更好的理解实验包含整个实验过程的所有资源,代码完整,附带实验说明,易于理解。
原reviews.xml有点不合适,用资源包里的替换掉就好。
最后,祝大家能早日做完实验,早回家。
2025/1/28 0:39:54 16.33MB 山东大学 数据科学
1
本文档主要是storm组件部署。
欢迎大家关注数据科学,本人不断为大家提供数据科学相关知识,如有疑问请随时沟通不断优化
2024/8/21 2:48:02 51KB storm
1
3D渐变下降学习目标了解同时更改y截距和斜率变量时梯度下降的工作原理了解偏导数的含义了解取偏导数的规则介绍在上一节中,我们讨论了如何考虑沿3-d成本曲线移动。
我们知道,沿着上面的3-d成本曲线移动,意味着更改回归线的$m$和$b$变量,如下所示。
我们这样做的目的是使我们的生产线更好地匹配我们的数据。
回顾二维的梯度下降在本课程中,我们将学习三个维度的梯度下降,但让我们首先记住当仅更改回归线的一个变量时它如何在两个维度上起作用。
在二维中,当仅更改一个变量$m$或$b$时,梯度下降意味着沿成本曲线前进或后退,并采用特定的步长。
为了确定是向前还是向后移动以及步长大小,我们假设站在此二维曲线(如下所示)上并感觉成本曲线的斜率来告诉我们如何移动。
朝一个方向迈进意味着我们的回归变量之一发生了变化。
因此,这是二维的下降。
什么是三维三维下降?3维梯度下降
2024/7/2 1:47:53 556KB JupyterNotebook
1
山东大学本科生数据科学导论复习材料,同时包括了17年到21年的四年考试真题详细版
1
数据科学入门,第二版,介绍数据科学基本知识的重量级读本,Google数据科学家作品。
  数据科学是一个蓬勃发展、前途无限的行业,有人将数据科学家称为“21世纪头号性感职业”。
本书从零开始讲解数据科学工作,教授数据科学工作所必需的黑客技能,并带领读者熟悉数据科学的核心知识——数学和统计学。
  作者选择了功能强大、简单易学的Python语言环境,亲手搭建工具和实现算法,并精心挑选了注释良好、简洁易读的实现范例。
书中涵盖的所有代码和数据都可以在GitHub上下载。
  通过阅读本书,你可以:  学到一堂Python速成课;
  学习线性代数、统计和概率论的基本方法,了解它们是怎样应用在数据科学中的;
  掌握如何收集、探索、清理、转换和操作数据;
  深入理解机器学习的基础;
  运用k-近邻、朴素贝叶斯、线性回归和逻辑回归、决策树、神经网络和聚类等各种数据模型;
  探索推荐系统、自然语言处理、网络分析、MapReduce和数据库。
2024/3/25 19:37:40 4.65MB data
1
三元闭包现象的数据验证,1.整个实验以矩阵为操作对象,邻接矩阵还是很有作用的,也便于理解2.R语言中有network数据结构,有IGraph包,计算聚集系数与介数都有已封装得函数。
2024/3/17 5:31:55 249KB 数据科学 三元闭包
1
COVID个人风险计算器根据您的年龄,性别,种族,症状,健康状况,行为等,计算个人患COVID的风险...风险=((活动案例中社区的比例)(症状概率)(敏感性))/(归一化因子)请注意,可以从NYTimesCOVID-19github上检索“us-counties.csv”文件。
链接到这里对症状风险的计算是通过对没有COVID和具有COVID的患者的症状报告进行逻辑回归。
ALAMA发表的论文将健康风险纳入了我们的计算器。
链接到这里根据年龄如何影响您的死亡,进入重症监护病房和住院的机会的不同研究,使用指数分布将COVID年龄转换为死亡,重症监护病房和住院的可能性。
社区风险是使用从NYTimesCOVID-19github检索的us-counties.csv文件计算的。
文件每周更新一次。
贡献者团队马凯文-团队负责人/数据科学家TimothyGa
2024/3/15 10:15:29 17.53MB Python
1
共 46 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡