一、数据分析项目介绍1. 项目所需的模块库介绍pandas用法:需要导入以下模块importnumpyasnpimportpandasaspdfrompandasimportSeries,Dataframe2.项目背景介绍互联网电影资料库(InternetMovieDatabase,简称IMDB)是一个关于电影演员、电影、电视节目、电视明星和电影制作的在线数据库。
电影作为艺术和娱乐载体已成为我们生活中的一部分,作为电影爱好者之一,希望通过分析了解电影市场大体情况,以便于以后选择电影观看。
使用的数据是IMDB美国票房排名前1000的电影数据,数据包含了电影名称,票房金额,上映年份,演职人员,IMDB评分,电影类型等信息,数据中的很多电影大家也比较熟悉。
相信不少人都有这样的经历,当想要看一部电影的时候,会去百度一下谁是导演,谁是主演。
如果导演是克里斯托弗•诺兰,心里已经给电影打了个8分以上的评分了。
而阿汤哥的动作片,预期也都能肾上腺素飙升。
对于已上映的电影,不少人会去豆瓣搜索现时的评分,或是前作的评价,若是豆瓣高分、高评论数,也会按奈不住去蹭下热度。
如果要去电影院观看的话,想必不少人会更倾向选择动作片或者科幻大片这类特效丰富,影音冲击强烈的电影。
近几年特效技术和3D动画的日渐成熟,影院观影已经是越来越多人的第一选择。
IMDB的资料中包括了影片的众多信息、演员、片长、内容介绍、分级、评论等。
对于电影的评分目前使用最多的就是IMDB评分。
截至2018年6月21日,IMDB共收录了4,734,693部作品资料以及8,702,001名人物资料。
3.项目所需数据介绍数据的属性包括:电影名称、评论数、评分、导演、上映时间、上映国家、主要演员、语言、IMDB评分等。
理解数据:color、director_name、num_critic_for_reviews、duration、director_facebook_likes、actor_3_facebook_likes、actor_2_name、actor_1_facebook_likes、gross、genres、actor_1_name、movie_title、num_voted_users、cast_total_facebook_likes、actor_3_name、facenumber_in_poster、plot_keywords、movie_imdb_link、num_user_for_reviews、language、country、content_rating、budget、title_year、actor_2_facebook_likes、imdb_score、aspect_ratio、movie_facebook_likes4.项目功能详细介绍显示电影评分分布的情况;
电影数量与平均分年度变化的情况;
评论家评论数与评分的关系;
评分与电影票房的关系;
电影数量大于5前提下平均分前十的导演推荐的数据;
不同电影类型的年份累计分析;
电影时长的分布及时长能否和评分有相关性;
电影时长的分布及时长能否和评分有相关性。
二、数据分析过程1.主要功能实现的类和方法介绍#清洗runtime电影时长列数据,可使用str.split()方法df['runtime']=df['runtime'].str.split('').str.get(0).astype(int)df['runtime'].head()#清洗year列,使用str[:]选取年份数字并转换成int类型,使用df.unique()方法检查数据df['year']=df['year'].str[-5:-1].astype(int)df['year'].unique()2. 数据分析过程代码和解释说明导入包:导入、查看、清洗数据:评分分布图:电影数量与平均分布年度变化:评论家评论数&评分、评分&票房:电影数量大于5平均分前十的导演:统计不同年份、不同类型电影的数量:cumsum=df.groupby(['main_genre','year']).title.count()#使用累加功能统计1980年起不同年份不同电影类型的累计数量,对于中间出现的缺失值,使用前值填充genre_cumsum=cumsum.unstack(level=0).cumsum().ffill()#只选取总数量大于
2023/1/19 6:32:34 459KB 数据分析
1
本书共分为三部分。
第一部分讲预测基础,次要涵盖预测概念理解、预测方法论、分析方法、特征技术、模型优化及评价,读者通过这部分内容的学习,可以掌握进行预测的基本步骤和方法思路;
第二部分讲预测算法;
第三部分讲预测案例。
2023/1/18 10:46:12 79.57MB R语言 统计 预测
1
全网首发,全部汉化。
添加4.47二次汇编代码;支持64位系统,解决SMART汉化乱码问题,彻底去除在PE环境下,对IE插件的调用。
可以为PE精简6M空间,原程序驱动不支持64位系统,因而,无法使用PIO模式!请尊重我的劳动成果,乱评价,立马停止更新和删除资源!
2023/1/16 4:10:08 1.72MB VICTORIA 4.47汉化版
1
决议试行及评价实验室评价(DEMATEL)
2023/1/16 2:45:22 6KB DEMATEL代码
1
西门子SMART\S7-200\S7-1200部分模块CPU的CAD图,免得本人画了,分享给大家!下载了觉得好用的记得评价一下哦。
西门子SMART\S7-200\S7-1200部分模块CPU的CAD图,免得本人画了,分享给大家!下载了觉得好用的记得评价一下哦。
西门子SMART\S7-200\S7-1200部分模块CPU的CAD图,免得本人画了,分享给大家!下载了觉得好用的记得评价一下哦。
西门子SMART\S7-200\S7-1200部分模块CPU的CAD图,免得本人画了,分享给大家!下载了觉得好用的记得评价一下哦。
2023/1/13 1:25:30 25.27MB SMART S7-200 S7-1200 CAD图
1
测试计划是在测试设计阶段,在需求规格说明书的基础上制定的文档。
测试计划包括测试资源、测试过程策划、评价方法以及测试进度安排等,是整个测试项目实施的根据。
2023/1/12 23:30:32 4.62MB 软件测试
1
编写目的编写本测试计划的目的是为整个测试阶段的管理工作和技术工作提供指南;
同时确定测试的内容和范围,为评价系统提供依据;
此外还协助用户安排测试活动,说明对设备器材和机构人员的资源需求;
说明测试结果的评价指标。
1.2背景说明本测试计划所属软件系统的名称、特征、要求和难点,以及在开始执行本测试计划之前必须完成的各项任务。
1.3参考资料《XX电子运行维护系统省内系统需求规范V2.0》《XX省EOMS系统需求规范V1.5》《概要设计说明书》《软件需求规格说明书》
2023/1/11 19:46:12 422KB 测试计划
1
本数据共享链改方案加强了数据共享的安全能力,通过记账体系激发数据提供者的积极性、扩大数据共享和信息协同范围,通过客观公证的评价体系提升共享数据质量,通过基于属性的授权机制提升数据共享的灵活性、隐私保护和数据溯源机制,同时减低管理维护成本。
采用本链改方案后,将全面提升跨组织、跨行业的数据共享能力,提升全社会的信息共享和协作水平。
2015/2/6 2:31:48 1.25MB DAPP
1
操作系统的课程设计,有最先适应法,最优适应法和最差适应法。
觉得好的就给个评价,谢谢
2016/11/13 21:51:25 896KB
1
目录1引言 22系统分析 32.1功能需求分析 32.2本系统采用的关键技术 42.2.1JSP技术 42.2.2JavaBean技术 42.2.3JDBC技术 52.2.4用JDBC访问数据库 62.3可行性分析 92.4系统运行环境 93系统概要设计 113.1总体功能 113.2E-R图 134系统详细设计 144.1后台数据库设计 144.1.1SQLSERVER介绍 144.1.2数据库表结构 154.2处理流程设计 174.2.1系统操作流程 174.2.2数据增加流程 184.2.3数据修改流程 184.3.4数据删除流程 194.3系统模块设计 204.3.1管理员登陆 204.3.2旧事管理 225系统调试与测试 265.1程序调试 265.2程序的测试 265.2.1测试的重要性及目的 265.2.2测试的步骤 285.2.3测试的主要内容 286结论 306.1系统评价 306.2安全性问题 30致谢 32参考文献 33
2016/6/23 3:15:17 3.87MB JSP+SQL网上新闻发布系统.rar
1
共 703 条记录 首页 上一页 下一页 尾页
在日常工作中,钉钉打卡成了我生活中不可或缺的一部分。然而,有时候这个看似简单的任务却给我带来了不少烦恼。 每天早晚,我总是得牢记打开钉钉应用,点击"工作台",再找到"考勤打卡"进行签到。有时候因为工作忙碌,会忘记打卡,导致考勤异常,影响当月的工作评价。而且,由于我使用的是苹果手机,有时候系统更新后,钉钉的某些功能会出现异常,使得打卡变得更加麻烦。 另外,我的家人使用的是安卓手机,他们也经常抱怨钉钉打卡的繁琐。尤其是对于那些不太熟悉手机操作的长辈来说,每次打卡都是一次挑战。他们总是担心自己会操作失误,导致打卡失败。 为了解决这些烦恼,我开始思考是否可以通过编写一个全自动化脚本来实现钉钉打卡。经过一段时间的摸索和学习,我终于成功编写出了一个适用于苹果和安卓系统的钉钉打卡脚本。
2024-04-09 15:03 15KB 钉钉 钉钉打卡