平台部分主要是hadoop分布式系统,基于该系统融合了组件Spark,Hbase,Hive,Sqoop,Mahout等。
继而进行相关的数据分析该项目主要分为以下几部分:1:数据采集主要是基于豆瓣电影的数据,进行分析,所以首先要爬取相关的电影数据,对应的源代码在DouBan_Spider目录下,主要是采用Python+BeautifulSoup+urllib进行数据采集2:ETL预处理3:数据分析4:可视化代码封装完好,适用于对作影视感情分析,影评分析,电影类型分析,推荐系统的建立
2023/9/29 13:13:36 10.05MB 爬虫 数据处理 数据分析 可视化
1
可用电梯卡数据分析工具,包含nfcpro,IC卡数据分析,电梯卡数据分析,ic卡数据分析工具解压后报毒不用管,不要升级此软件,否则无法使用
1
Stata是一套提供其使用者数据分析、数据管理以及绘制专业图表的完整及整合性统计软件。
它提供许许多多功能,包含线性混合模型、均衡重复反复及多项式普罗比模式。
用Stata绘制的统计图形相当精美。
新版本的STATA采用最具亲和力的窗口接口,使用者自行建立程序时,软件能提供具有直接命令式的语法。
Stata提供完整的使用手册,包含统计样本建立、解释、模型与语法、文献等超过一万余页的出版品。
除此之外,Stata软件可以透过网络实时更新每天的最新功能,更可以得知世界各地的使用者对于STATA公司提出的问题与解决之道。
使用者也可以透过StataJournal获得许许多多的相关讯息以及书籍介绍等。
另外一个获取庞大资源的管道就是Statalist,它是一个独立的listserver,每月交替提供使用者超过1000个讯息以及50个程序。
2023/9/27 12:12:27 52.34MB Stata1 数据分析
1
AWSKRUG动手练习2018AWSKRUG动手练习2018是每两周的周六HoLs,直到10月20日(9节,每HoL70pax),主题为容器,无服务器和数据分析。
这是自愿制作的指南。
如果您想加入HoL,请参阅。
6月2日–(韩语)6月16日–(韩语)6月30日–(韩语)7月14日–(韩文)7月28日–(韩语)8月11日–(韩语)9月8日–(韩语)9月29日–(韩语)10月20日–(韩语)
2023/9/27 10:53:57 26.35MB aws usergroup hands-on awskrug
1
保留原有所有功能,新增直接从mapinfo图层输出googleearthkml文件的工具。
Mapinfo2Googleearth将ADA_CDMATool基础上生成的CDMA_Cell_Map_NB图层直接转为googleearth的kml文件。
kml保留扇区的三叶草图形,全向站用六边形标识。
///////原有功能/////////ADACDMAToolHelp扇区信息表格式 扇区信息表:CdmaCellInfo.xls。
“Bearing”列为方位角,“radius”列为半径,“FREQ”列为不同频率,“H_BeamWidth”为扇区水平瓣宽,“Longitude”经度,“Latitude”纬度。
“扇区类型”列用“射频拉远”标识是否RRU站。
“基站名”列标识站名或者射频拉远站的施主站名。
“物理地址”列标识实际站点站名。
“NeighborNumber”列保存对应扇区的邻小区数。
“N01”记录第一个邻小区的小区号,必须放在第24列。
MakeCell用来生成扇区结构的mapinfo图层,用不同的方位角和半径来区分同一物理地址不同频点的扇区。
扇区信息表:CdmaCellInfo.xls,放在和本插件同一目录下。
并在同一目录下生成图层CDMA_Cell_Map_NB。
下图即为生成的基站扇区图,圆形为全向站(包括室分系统)注:以下所有的工具均需要在生成的CDMA_Cell_Map_NB图层上工作!RRULine 用来生成RRU站和施主站之间的连线。
用箭头工具点击扇区,如果扇区是RRU站则画出其与施主站之间的连线。
用RECT工具进行区域选择,程序会将区域范围内的RRU站与施主站之间连线。
DrawRRULineall 一次性生成CDMA_Cell_Map_NB图层中所有RRU站与其施主站间的连线。
注:生成全网的RRU联线,所需时间较长。
FindPN 用来查找CDMA_Cell_Map_NB图层中所有指定PN的扇区,填充颜色并标注PN。
可以用此来检查PN复用距离。
下图为findPN274的结果,标注PN274并红色填充对应扇区。
NBCheck 显示所选择扇区的所有邻小区并用颜色填充。
可以用此来查看是否有明显的PN漏配。
如果点击选择的位置有多个扇区时,会弹出选择对话框供用户确定扇区。
PNOneWayCheck点击图层,输出所点击扇区的邻小区重复PN信息,或者多余邻小区信息(多余邻小区为小区号已经不在现网中)。
注:PNOneWay和Twoway与某一地点的覆盖有很大关系,并不仅仅是邻小区设置的问题,程序中只是检查了基站邻小区的PN是否有重复PNTwoWayCheck 检查所点击扇区的邻小区、所有二次邻小区(邻小区的邻小区)之间的PN是否有重复。
如果二次邻小区PN重复,则可能存在PNTwoway的风险print出PNTwoway点位的Cell信息,在map上连线,显示造成Twoway的邻小区路径。
注:此程序运行时间视邻小区个数与PN重复数有关,在2min~10min左右注:PNOneWay和Twoway与某一地点的覆盖有很大关系,并不仅仅是邻小区设置的问题,程序中检查了基站邻小区、所有二次邻小区的PN是否有重复PNTwoWayCheck2 检查所点击扇区的邻小区与二次邻小区之间的PN复用关系,不检查二次邻小区之间的复用关系。
用不同的颜色填充和连线显示出可能存在的PNTwoWay,此工具检查出来的PNTwoWay结果比PNTwoWayCheck检查出来的结果更有风险。
话统数据分析 选择需要分析的数据列,或者输入需要分析的数据列(输入的列名要与CdmaCellInfo.xls中的列名完全一致),输入分析数据的最大值和5类层级的填充颜色和范围。
用不同的颜色标识属于不同范围的扇区,并用图示标识出来。
2023/9/22 19:34:05 4.37MB CDMA 网络优化 插件 googleearth
1
完整版淘宝单类商品全品类数据挖掘及数据分析代码,设计库:requests,pandas,matplotlib,xlwt,神器jieba,wordcloud等等代码里因为爬虫部分执行需要几秒时间,所以注释掉了,使用的话放开即可。
2023/9/22 19:14:06 4.06MB python 3.6 ubuntu 16
1
爬取苏宁易购得到的空调商品评论,可用于数据分析学习,不得用作商业用途。
2023/9/21 18:48:51 669KB 数据挖掘 自然语言处理 LDA Tfidf
1
xrd数据分析软件jade6.0入门使用手册——黄继武版本,提供初学者使用
2023/9/19 21:22:21 1.76MB jade,xrd
1
2019年工业大数据分析个人学习总结分享参考工业大数据是智能制造的核心,其基础是大数据和工业互联网,所需要的技术有云计算、大数据、物联网、人工智能,工业大数据核心技术是工业大数据分析技术。
1
一个采用Delphi编制的任意次多项式曲线拟合类及其演示算例。
有四种多项式可供选择:幂指数多项式、勒让德多项式、车比雪夫多项式、埃米特多项式,并实现了拟合后曲线的求导运算。
可用于实验数据分析方面的编程。
2023/9/18 8:36:54 279KB 曲线拟合、多项式、Delphi
1
共 655 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡