从雅虎金融上面自动下载csv文件,供量化和分析使用修改save_path为自己的本地地址,输入股票代码,即可下载。
2025/12/11 18:15:52 1KB python 金融
1
用python写的一个json转csv文件的脚本,csv文件的分隔符用的'|',hardcode到代码里了。
使用方法:1.直接执行pythonjson2csv.py(待转换文件hardcode到代码里)2.转换完后先打开excel,然后从excel里面找到转换后文件.csv打开(注意不能直接打开否则会有乱码)
2025/12/8 10:20:30 1KB python json csv
1
可用做深度学习测试的一维线性回归数据集。
数组大小247*900,实验数据取自真实场景,回归精度好。
9种特征,每种特征有100条数据。
2025/12/7 2:38:30 1.67MB 深度学习 线性回归
1
TDS(运输数据科学)这是GitHubRepository(简称仓库),支持利兹大学的运输数据科学模块的教学。
学生可以在以及(从2022年开始)的MSc课程中学习该模块。
可以在找到模块目录。
课程随附的计算机代码可在code文件夹中找到。
要运行此代码,您将需要安装R和Python以及各种软件包和库。
时间表可以找到:在大学系统上(官方)::以ical格式(用于导入Google/Outlook/其他日历系统)::作为.csv文件(为了易于读取为数据)::见下面的会议模块时间表如下表所示。
概括描述Dtstart地点期间TDS截止日期1电脑设置2021-01-2913:00:00在线-团队240分钟TDS讲座1:简介在线运输数据科学概论-团队2021-02-0109:00:00在线-团队60分钟TD
2025/12/4 21:19:27 14.33MB JavaScript
1
应客户要求,导出数据库中的数据为Excel,只在一个Sheet中,Excel中的内容要与数据库里的内容一致(主要针对日期型数据)。
由于之前接触过POI,对POI的一些特性还是有一定的了解的,因此顺其自然的用POI去解决这个问题。
POI3.8版本之前的版本处理大量数据的导出Excel效果不是很理想,主要在与Excel2003版本单个Sheet的行限制为65536,大量数据的导出得分多个Sheet,针对这一点,客户就不会满意。
其次,在实验过程中,大数据量的导出很容易引发内存溢出,调整JVM的内存大小治标不治本。
很多人建议保存为.CSV格式的文件。
不过,.CSV方式导出也存在问题:首先,如果用excel来打开csv,超过65536行的数据都会看不见,这是Excel程序的问题。
其次,如果要导出一个身份证号码,手机号码等纯数字构成的字符串,在excel中打开csv时,这些字段很容易被识别成数字,被误处理。
POI3.8以后的版本支持Excel2007高版本,单个Sheet的行数可达到百万,针对内存溢出问题,可通过设置内存数据保留数,每当计数到指定的数值时,刷新数据到硬盘,清理内存。
2025/12/4 20:31:48 11.18MB Sybase Mysql SQLServer
1
包含基本数据data.csv结果逻辑result.dot还有dot可视化工具graphiviz(安装,配置环境变量,按照命令执行即可)
2025/11/28 3:35:09 31.73MB graphviz
1
CSV拆分工具使用方法及介绍:https://blog.csdn.net/weixin_41287692/article/details/86489723
1
Asp.net导出Excel文件总结(导出csv、OfficeCOM组建、JetOLEDB、NPOI)
2025/11/3 20:49:06 1.98MB asp.net 导出Excel
1
由于原文件超出220M,需要原始文件的请下载好该文件后私信我,我会提供原始CSV文件,如有需要,还可以提供原始网络流量数据.pcap格式的。
分数要求不高,只是因为我是研究这个方向的,希望有志之士可以一起探讨。
使用该数据集同样需要注明出处,请私信我。
我在做这个方向时,花了很长时间找数据集,除了上传的,还有其他的,如果有需要的,可以问问我。
2025/10/21 19:06:50 212.8MB 入侵检测 数据集 有标签
1
糖尿病数据集"diabetes.csv"是一个广泛用于统计分析和机器学习任务的数据集,特别是针对深度学习的应用。
这个数据集包含了大量关于糖尿病患者的医疗记录,旨在帮助研究者们预测糖尿病的发展趋势或者评估疾病管理策略的效果。
下面我们将深入探讨该数据集中的关键知识点。
1.数据集结构:通常,CSV(CommaSeparatedValues)文件是一种存储表格数据的格式,每一行代表一个观测值,列则对应不同的特征或变量。
在这个糖尿病数据集中,每一行可能代表一个患者在特定时间点的健康状况。
2.特征详解:-年龄(Age):患者年龄,对于疾病发展有显著影响。
-性别(Sex):患者性别,男性和女性可能面临不同的糖尿病风险。
-BMI(BodyMassIndex):身体质量指数,是衡量体重与身高比例的一个指标,与糖尿病风险相关。
-血压(BloodPressure):血压水平,高血压是糖尿病并发症的重要因素。
-葡萄糖(Glucose):血液中的葡萄糖浓度,直接影响糖尿病的诊断。
-胆固醇(Cholesterol):血液中的胆固醇含量,高胆固醇可能加剧糖尿病并发症。
-心电图(ECG):心电图结果,可以反映心脏健康状况,可能影响糖尿病的整体管理。
-尿蛋白(UrineProtein):尿液中的蛋白质含量,异常可能表明肾脏受损,常见于糖尿病并发症。
-甲状腺刺激激素(TSH):甲状腺功能的指标,甲状腺问题可能与糖尿病有关联。
-以及其他可能的医疗指标和历史数据。
3.目标变量:数据集可能包含一个目标变量,例如“糖尿病进展”或“并发症发生”,用于预测模型的训练和验证。
这个变量可能是二元的(如无/有并发症)或连续的(如疾病严重程度评分)。
4.数据预处理:在使用数据集之前,通常需要进行数据清洗,处理缺失值、异常值,以及可能的分类变量编码。
此外,为了适应深度学习模型,可能需要对数值特征进行标准化或归一化。
5.模型构建:在深度学习中,可以使用各种神经网络架构,如卷积神经网络(CNN)用于特征提取,循环神经网络(RNN)处理时间序列数据,或者全连接网络(FCN)处理一般的数据。
更先进的模型如长短时记忆网络(LSTM)或门控循环单元(GRU)也能用于捕捉患者健康状况随时间变化的模式。
6.训练与评估:模型的训练通常涉及反向传播和优化算法(如梯度下降或Adam)。
评估指标可能包括准确率、召回率、F1分数、AUC-ROC曲线等,具体取决于任务的性质。
7.隐私与伦理:在处理这类个人健康数据时,必须遵守严格的隐私保护规定,确保数据脱敏且匿名化,以保护患者隐私。
8.预测与解释:模型预测的结果需要解释,以便医生和患者理解并采取相应行动。
可解释性机器学习方法如局部可解释性模型(LIME)和SHAP值可以提供洞察模型决策背后的特征重要性。
"diabetes.csv"数据集为糖尿病研究提供了一个宝贵的资源,通过深度学习方法,我们可以挖掘其中的潜在规律,提高疾病预测的准确性,并为患者提供更好的健康管理建议。
在实际应用中,要充分利用数据集,同时确保数据安全和合规性。
2025/10/12 17:01:14 9KB 数据集
1
共 392 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡