spark搜狗日志数据饭呢西实战源码(搜索了局和点击排名都是第一)
2023/3/14 6:15:37 273KB spark 搜狗日志 分析源码
1
通过EE214等资料的学习,我们都会觉得gm/id设计方法十分方便直观有效率,但是对于众多使用Cadence作为设计工具的初学者们,Id/w~gm/Id,fT~gm/Id这些设计需要查用的特征曲线怎样得到确实一头雾水。
本人也是刚刚涉及模仿IC的设计,对于Cadence的使用也是相当不咋地,但是该设计方法确实诱人,所以找了一些资料,学习了这些曲线的绘制方法,写出来和大家分享,热烈欢迎批评指正,另外,本文的前半部分主要是对一文献的翻译(参考文献排名第一是也),后半部分为原创。
2023/3/10 16:36:05 498KB gmid
1
《营商环境报告》涵盖12个领域的商业法规。
营商环境便利度分数和营商环境便利度排名涵盖了其中的10个领域:开办企业,办理施工许可证,获得电力,登记财产,获得信贷,保护少数投资者,纳税,跨境贸易,执行合同和办理破产。
《营商环境报告》也衡量了有关雇用员工和政府采购的规定,但是这两个目标不包括在营商环境便利度分数计算和排名中。
2023/3/5 20:10:51 1.47MB 世界银行报告 营商环境 贸易
1
数据挖掘算法算法目录18大DM算法包名 目录名 算法名AssociationAnalysis DataMining_Apriori Apriori-关联规则挖掘算法AssociationAnalysis DataMining_FPTree FPTree-频繁模式树算法BaggingAndBoosting DataMining_AdaBoost AdaBoost-装袋提升算法Classification DataMining_CART CART-分类回归树算法Classification DataMining_ID3 ID3-决策树分类算法Classification DataMining_KNN KNN-k最近邻算法工具类Classification DataMining_NaiveBayes NaiveBayes-朴素贝叶斯算法Clustering DataMining_BIRCH BIRCH-层次聚类算法Clustering DataMining_KMeans KMeans-K均值算法GraphMining DataMining_GSpan GSpan-频繁子图挖掘算法IntegratedMining DataMining_CBA CBA-基于关联规则的分类算法LinkMining DataMining_HITS HITS-链接分析算法LinkMining DataMining_PageRank PageRank-网页重要性/排名算法RoughSets DataMining_RoughSets RoughSets-粗糙集属性约简算法SequentialPatterns DataMining_GSP GSP-序列模式分析算法SequentialPatterns DataMining_PrefixSpan PrefixSpan-序列模式分析算法StatisticalLearning DataMining_EM EM-期望最大化算法StatisticalLearning DataMining_SVM SVM-支持向量机算法其他经典DM算法包名 目录名 算法名Others DataMining_ACO ACO-蚁群算法Others DataMining_BayesNetwork BayesNetwork-贝叶斯网络算法Others DataMining_CABDDCC CABDDCC-基于连通图的分裂聚类算法Others DataMining_Chameleon Chameleon-两阶段合并聚类算法Others DataMining_DBSCAN DBSCAN-基于密度的聚类算法Others DataMining_GA GA-遗传算法Others DataMining_GA_Maze GA_Maze-遗传算法在走迷宫游戏中的应用算法Others DataMining_KDTree KDTree-k维空间关键数据检索算法工具类Others DataMining_MSApriori MSApriori-基于多支持度的Apriori算法Others DataMining_RandomForest RandomForest-随机森林算法Others DataMining_TAN TAN-树型朴素贝叶斯算法Others DataMining_Viterbi Viterbi-维特比算法18大经典DM算法18大数据挖掘的经典算法以及代码实现,涉及到了决策分类,聚类,链接挖掘,关联挖掘,模式挖掘等等方面,后面都是相应算法的博文链接,希望能够协助大家学。
目前追加了其他的一些经典的DM算法,在others的包中涉及聚类,分类,图算法,搜索算等等,没有具体分类。
C4.5C4.5算法与ID3算法一样,都是数学分类算法,C4.5算法是ID3算法的一个改进。
ID3算法采用信息增益进行决策判断,而C4.5采用的是增益率。
详细介绍链接CARTCART算法的全称是分类回归树算法,他是一个二元分类,采用的是类似于熵的基尼指数作为分类决策,形成决策树后之后还要进行剪枝,我自己在实现整个算法的时候采用的是代价复杂度算法,详细介绍链接KNNK最近邻算法。
给定一些已经训练好的数据,输入一个新的测试数据点,计算包含于此测试数据点的最近的点的分类情况,哪个分类的类型占多数,则此测试点的分类与此相同,所以在这里,有的时候可以复制不同的分类点不同的权重。
近的点的权重大点,远的点自然就小点。
详细介绍链接NaiveBayes朴素贝叶斯算法。
朴素贝叶斯算法是贝叶斯算法里面一种比较简单的分类算法,用到了一个比较重要的贝叶斯定理,用一句简单的话概括就是条件概率的相互转换推导
2023/3/5 1:58:33 220KB 数据挖掘 18大 算法 DM
1
C言语初学者数据结构初学者
2023/2/20 5:52:41 428KB c语言 数据结构
1
a),目的:1,掌握计算机管理信息系统设计的一般方法,主要包括系统分析、系统设计的组织和实施。
2,关系型数据库管理系统的编程技术,并能独立完成一般小系统的程设计、调试运行等工作。
3, 培养把所学知识运用到具体对象,并能求出处理方案的能力。
b),要求:1,E-R图设计;
2,创建数据库、数据表等;
3,完成下面部分功能:a) 对全校的班级进行汇总,以及增加,修改,删除,按条件查询,班级信息b) 对各个班级的学生进行管理,具有档案信息增加,修改,按条件等c) 对本学期所有学费的设置、修改,以及每个学生交费信息的管理、查询d) 设置本学期全校开设的课程和配套的教材,以及指定各个年级的开设的课程信息e) 每学期学生成绩的添加,删除,查询,以及总分和单科成绩排名。
1
目标跟踪算法的代码完成,精度在vot2018排名第一,鲁棒性很强.
2023/2/5 11:51:28 17KB 目标跟踪 深度学习 python
1
出自:http://blog.liyang1.com/wdgz/3若不分明这是干撒爹,请先阅读哟~
2023/1/24 14:32:37 334KB 查询竞价排名
1
一、数据分析项目介绍1. 项目所需的模块库介绍pandas用法:需要导入以下模块importnumpyasnpimportpandasaspdfrompandasimportSeries,Dataframe2.项目背景介绍互联网电影资料库(InternetMovieDatabase,简称IMDB)是一个关于电影演员、电影、电视节目、电视明星和电影制作的在线数据库。
电影作为艺术和娱乐载体已成为我们生活中的一部分,作为电影爱好者之一,希望通过分析了解电影市场大体情况,以便于以后选择电影观看。
使用的数据是IMDB美国票房排名前1000的电影数据,数据包含了电影名称,票房金额,上映年份,演职人员,IMDB评分,电影类型等信息,数据中的很多电影大家也比较熟悉。
相信不少人都有这样的经历,当想要看一部电影的时候,会去百度一下谁是导演,谁是主演。
如果导演是克里斯托弗•诺兰,心里已经给电影打了个8分以上的评分了。
而阿汤哥的动作片,预期也都能肾上腺素飙升。
对于已上映的电影,不少人会去豆瓣搜索现时的评分,或是前作的评价,若是豆瓣高分、高评论数,也会按奈不住去蹭下热度。
如果要去电影院观看的话,想必不少人会更倾向选择动作片或者科幻大片这类特效丰富,影音冲击强烈的电影。
近几年特效技术和3D动画的日渐成熟,影院观影已经是越来越多人的第一选择。
IMDB的资料中包括了影片的众多信息、演员、片长、内容介绍、分级、评论等。
对于电影的评分目前使用最多的就是IMDB评分。
截至2018年6月21日,IMDB共收录了4,734,693部作品资料以及8,702,001名人物资料。
3.项目所需数据介绍数据的属性包括:电影名称、评论数、评分、导演、上映时间、上映国家、主要演员、语言、IMDB评分等。
理解数据:color、director_name、num_critic_for_reviews、duration、director_facebook_likes、actor_3_facebook_likes、actor_2_name、actor_1_facebook_likes、gross、genres、actor_1_name、movie_title、num_voted_users、cast_total_facebook_likes、actor_3_name、facenumber_in_poster、plot_keywords、movie_imdb_link、num_user_for_reviews、language、country、content_rating、budget、title_year、actor_2_facebook_likes、imdb_score、aspect_ratio、movie_facebook_likes4.项目功能详细介绍显示电影评分分布的情况;
电影数量与平均分年度变化的情况;
评论家评论数与评分的关系;
评分与电影票房的关系;
电影数量大于5前提下平均分前十的导演推荐的数据;
不同电影类型的年份累计分析;
电影时长的分布及时长能否和评分有相关性;
电影时长的分布及时长能否和评分有相关性。
二、数据分析过程1.主要功能实现的类和方法介绍#清洗runtime电影时长列数据,可使用str.split()方法df['runtime']=df['runtime'].str.split('').str.get(0).astype(int)df['runtime'].head()#清洗year列,使用str[:]选取年份数字并转换成int类型,使用df.unique()方法检查数据df['year']=df['year'].str[-5:-1].astype(int)df['year'].unique()2. 数据分析过程代码和解释说明导入包:导入、查看、清洗数据:评分分布图:电影数量与平均分布年度变化:评论家评论数&评分、评分&票房:电影数量大于5平均分前十的导演:统计不同年份、不同类型电影的数量:cumsum=df.groupby(['main_genre','year']).title.count()#使用累加功能统计1980年起不同年份不同电影类型的累计数量,对于中间出现的缺失值,使用前值填充genre_cumsum=cumsum.unstack(level=0).cumsum().ffill()#只选取总数量大于
2023/1/19 6:32:34 459KB 数据分析
1
对宋体识别较好Tesseract可能是可用的最精确的开源OCR引擎。
它与图片处理库结合,可以读取各种格式的图像并将它们转换成超过60种语言的文本。
它是1995年UNLV精度测试中排名前3的引擎之一。
2021/6/24 23:08:54 18.7MB OCR识别 tesseract chi_sim
1
共 168 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡