应用办公生活信息教育商业
投稿投诉
商业财经
汽车智能
教育国际
房产环球
信息数码
热点科技
生活手机
晨报新闻
办公软件
科学动态
应用生物
体育时事

Python和Excel终于互通了!这个插件能自动生成代码实

  加载一个Jupyter插件后,无需写代码就能做数据分析,还帮你生成相应代码?
  没错,只需要加载这个名为Mito的小工具包,用Python做数据分析,变得和用Excel一样简单:
  介绍
  以Excel为代表的电子表格是探索数据集的最重要、最具适应性的方式之一。它可以帮助对数据类型进行必要的更改、创建新特征、对数据进行排序以及从现有特征中创建新特征。
  遵循以上相同的思路,Mito是一个JupyterLab扩展和Python库,它使得在支持GUI的电子表格环境中操作数据变得超级容易。
  Mito的出现,像是将Python的强大功能、和Excel的易用性进行了结合。
  只需要掌握Excel的用法,就能使用Python的数据分析功能,还能将写出来的代码打包带走。
  它弥补了Excel在数据分析上的几个缺陷:Excel无法做大数据分析(大型数据集处理得不好)Excel运行缓慢Excel无法轻松创建可重复流程
  同时,又比SQL和Python更简单、直观。毕竟这些专业工具对于0基础初学者来说,需要至少几年时间,才能完全上手。
  在本文中,我们将一起学习:如何合理设置Mito如何debug安装错误使用Mito提供的各种功能数据库如何为对数据集所做的所有操作生成Python等效代码安装Mito
  Mito是一个Python库,可以通过pip包管理器安装。它需要Python3。6及以上版本。此外,系统上需要安装Nodejs,一个JavaScript运行时环境。
  另外,可以在单独的环境(虚拟环境)中安装这个包,可以避免一些依赖错误。接下来在终端中运行这些命令,完成安装即可。1。创建环境
  我正在使用Conda创建一个新环境。你还可以使用Python的venv来创建虚拟环境。condacreatenmitoenvpython3。82。激活环境condaactivatemitoenv3。通过pip安装Mitopipinstallmitoinstaller4。运行Mito安装程序pythonmmitoinstallerinstall
  此过程将需要一段时间来安装和设置Mito。5。启动JupyterLabjupyterlab报错解决
  当启动JupyterLab时,可能会遇到如下错误:Filec:userslenovoanaconda3envsmitoenvlibsitepackagesjupytercorepaths。py,line387,inwin32restrictfiletouserimportwin32apiImportError:DLLloadfailedwhileimportingwin32api:Thespecifiedmodulecouldnotbefound。
  要修复此错误,只需运行以下命令:pipinstallupgradepywin32225
  如果你遇到其他困难,请随时在下面发表评论。我很乐意提供帮助。MitoSheets界面
  在JupyterLab中,创建一个新笔记本并初始化Mitosheet:importmitosheetmitosheet。sheet()
  第一次,系统会提示输入你的电子邮件地址进行注册:
  填写完基础知识后,将被重定向到GUI电子表格。接下来我们一起看看这个接口的所有特性,并一起学习如何生成Python等效代码。加载数据集
  要在MitoSheets中加载数据集,只需单击导入。有两个选择:从当前文件夹添加文件:这将列出当前目录中的所有CSV文件,可以从下拉菜单中选择文件。按文件路径添加文件:这将仅添加该特定文件。
  如下图所示
  如果你看下面的单元格,你会发现Python等效的代码导入一个数据集使用pandas已经生成了适当的注释!
  这就是Mito的魅力,你在Mitosheet执行的每个操作都将转换为Python等效代码!接下来我们一起详细探讨一下Mito的所有功能。添加和删除列添加列
  就像在Excel等电子表格中一样,你可以添加一个新列,该列可能是从现有列或特征创建的。要在Mito中执行此操作,只需单击AddCol按钮。该列将添加到当前选定的列表旁边。最初,列名将是一个字母表,列的所有值都为零。
  编辑新列的内容单击行列名称(分配的字母表)将弹出侧边栏菜单,你可以在其中编辑列的名称。要更新该列的内容,请单击该列的任何单元格,然后输入值。你可以输入一个常量值,也可以根据数据集的现有特征创建数据。如果要从现有列创建值,则直接使用要执行的运算符调用列名。新列的数据类型根据分配的值进行更改。
  下面的GIF演示了上面提到的所有内容:
  删除列通过单击选择任何列。单击DelCol,该特定列将从数据集中删除。
  Python代码
  在下一个单元格中生成带有正确注释的Python等效代码,用于执行的操作是:MITOCODESTART(DONOTEDIT)frommitosheetimportImportnecessaryfunctionsfromMitoregisteranalysis(UUID7bf77d2684f448edb3893f7a3b729753)LetMitoknowwhichanalysisisbeingrunImportededxCourses。csvimportpandasaspdedxCoursescsvpd。readcsv(edxCourses。csv)AddedcolumnHtoedxCoursescsvedxCoursescsv。insert(7,H,0)RenamedHtonewColinedxCoursescsvedxCoursescsv。rename(columns{H:newCol},inplaceTrue)SetnewColinedxCoursescsvtocoursePricecourseEnrollmentsedxCoursescsv〔newCol〕edxCoursescsv〔coursePrice〕edxCoursescsv〔courseEnrollments〕DeletedcolumnnewColfromedxCoursescsvedxCoursescsv。drop(newCol,axis1,inplaceTrue)MITOCODEEND(DONOTEDIT)创建数据透视表
  数据透视表是一个重要的环节excel功能,它根据另一个分类特征汇总数字变量。要使用Mito创建这样的表,单击Pivot并选择源数据集(默认加载CSV)选择数据透视表的行、列和值列。还可以为值列选择聚合函数。所有下拉选项,如求和、平均值、中值、最小值、最大值、计数和标准偏差都可用。选择所有必要的字段后,将获得一个单独的表,其中包含数据透视表的实现。
  下面的GIF演示了如何为聚合函数均值创建数据透视表:
  Python代码MITOCODESTART(DONOTEDIT)frommitosheetimportImportnecessaryfunctionsfromMitoregisteranalysis(UUIDa35246c0e0dc436b8667076d4f08e0c1)LetMitoknowwhichanalysisisbeingrunImportededxCourses。csvimportpandasaspdedxCoursescsvpd。readcsv(edxCourses。csv)PivotededxCoursescsvintodf2pivottableedxCoursescsv。pivottable(index〔courseOrganization〕,values〔coursePrice〕,aggfunc{coursePrice:mean})Resetthecolumnnameandtheindexesdf2pivottable。renameaxis(None,axis1)。resetindex()MITOCODEEND(DONOTEDIT)合并两个数据集
  合并数据集是数据科学项目的重要组成部分。通常,数据集被划分到不同的表格中,以增加信息的可访问性和可读性。合并Mitosheets很容易。单击Merge并选择数据源。需要指定要对其进行合并的键。也可以从数据源中选择合并后要保留的列。默认情况下,所有列都将保留在合并的数据集中。
  Python代码MITOCODESTART(DONOTEDIT)frommitosheetimportImportnecessaryfunctionsfromMitoregisteranalysis(UUID88ac4a92062f4ed8a55d729394975740)LetMitoknowwhichanalysisisbeingrunImportedAirportPets。csv,ZipcodeData。csvimportpandasaspdAirportPetscsvpd。readcsv(AirportPets。csv)ZipcodeDatacsvpd。readcsv(ZipcodeData。csv)MergedAirportPetscsvandZipcodeDatacsvtempdfZipcodeDatacsv。dropduplicates(subsetZip)AirportPetscsvtmpAirportPetscsv。drop(〔State,Division〕,axis1)ZipcodeDatacsvtmptempdf。drop(〔MeanIncome,Pop〕,axis1)df3AirportPetscsvtmp。merge(ZipcodeDatacsvtmp,lefton〔Zip〕,righton〔Zip〕,howleft,suffixes〔AirportPetscsv,ZipcodeDatacsv〕)MITOCODEEND(DONOTEDIT)修改列数据类型、排序和过滤
  你可以更改现有列的数据类型,按升序或降序对列进行排序,或通过边界条件过滤它们。在Mito中的这些都很简单,可以通过选择屏幕上的选项通过GUI本身完成。单击所需的列将看到一个数据类型列表。可以根据需要从下拉列表中选择任何数据类型,该数据类型将应用于整个列。接下来可以通过选择提供的选项按升序或降序对数据进行排序。还可以使用自定义过滤器过滤数据。
  Python代码MITOCODESTART(DONOTEDIT)frommitosheetimportImportnecessaryfunctionsfromMitoregisteranalysis(UUIDcc414267d9aa40178890ee3b7461c15b)LetMitoknowwhichanalysisisbeingrunImportededxCourses。csvimportpandasaspdedxCoursescsvpd。readcsv(edxCourses。csv)ChangedcoursePricefromint64tofloatedxCoursescsv〔coursePrice〕edxCoursescsv〔coursePrice〕。astype(float)SortedcoursePriceinedxCoursescsvindescendingorderedxCoursescsvedxCoursescsv。sortvalues(bycoursePrice,ascendingFalse,napositionfirst)edxCoursescsvedxCoursescsv。resetindex(dropTrue)FilteredcoursePriceinedxCoursescsvedxCoursescsvedxCoursescsv〔edxCoursescsv〔coursePrice〕500〕edxCoursescsvedxCoursescsv。resetindex(dropTrue)MITOCODEEND(DONOTEDIT)图表和统计数据生成
  还可以直接在此扩展中生成图形,而无需编写绘图逻辑。默认情况下,此扩展生成的所有图都是使用Plotly制作的。这意味着绘图是交互式的,可以即时修改。
  注意,这里并没有像操作列一样,在下一个单元格中生成图形代码(也许开发人员会在以后的更新中推送此代码)
  可以使用Mito生成两种类型的图:1。通过点击图表按钮
  你将看到一个侧边栏菜单,用于选择图形类型和要选择的相应轴。
  2。通过点击列名
  当你点击电子表格中的列名称时,可以看见过滤器和排序选项。但如果你导航到SummaryStats,则会根据变量的类型显示线图或条形图以及变量的摘要。此摘要更改为文本和没有文本变量。
  保存和回放
  对数据集所做的所有转换都可以保存并用于其他类似的数据集。这在Excel中采用宏或VBA的形式。也可以通过这些功能完成相同的操作。
  文件是以Python编写的,而不是用比较难懂的VBA。
  回溯执行的所有步骤
  要想重复上面的步骤的话,也非常容易,Mito自带重复已保存分析步骤功能,一键就能用同样的方法分析其他数据。这个功能是最有趣的。你实际上可以追踪在Mitosheet中应用的所有转换。所有操作的列表都带有适当的标题。
  此外,你可以查看该特定步骤!这意味着假设你更改了一些列,然后删除了它们。你可以退回到未删除的时间。
  写在最后
  新工具Mito,用于在Python环境中实现类似电子表格的功能,并为所做的每一步生成等效操作的Python代码。
  参考来源:数据STUDIO

梅赛德斯AMGGTS跑车非常快而且非常黄如果您因为标准车的469马力不足而拒绝购买梅赛德斯AMGGT跑车,但是宽体GTC跑车的549马力实在太多了,我们将为您提供一流的新闻。中级GTS不再仅作为双门轿跑车提供您现在也……梅赛德斯amgA35在南非的价格根据我们的理解,新的婴儿AMG将在2019年10月左右到达SA。它由2。0升涡轮增压4缸电机驱动,产生225千瓦和400千米。动力通过一个7速双离合器变速器进入所有4个车轮。加……菊花和它是绝配!经常泡水喝,养肝又润肠,还能醒脑明目!赶紧给天气是越来越干燥了,我看到很多同事已经开始喝菊花茶了。这菊花素有延寿客之称,对于风热感冒、头痛眩晕、目赤肿痛、眼目昏花有很好的效果。而且从现代医学来看,菊花含挥发油、菊甙……宝马x8m将成为单机M车型的新平台关于宝马计划在它的最高范围的谣言不断变得更加奇怪。我们所知道的是,混合动力的i8旗舰车型已经不再是这样了,因为经过多年的嗡嗡声,它上个月已经停产,但却没有带来满意的销售。似乎有……宝马对5系和6系GranTurismo进行了改造宝马整日忙于整容。5系列轿车和Touring以及6系列GranTurismo均已轻柔地应用了中年童话般的灰尘。如果您一直在关注宝马的最新发展,您将会发现主要的视觉变化是更……机油用什么能洗掉(去除机油最好的溶剂)随着现在社会的发展,人们的生活水平的提高,有车一族也是越来越普遍了,几乎每家都有一辆自己的车,但是用车都难免有要自己去修理它的时候,这个时候很多人都往往会被汽车黑黑的机油给蹭到……软顶特斯拉Model3敞篷车是存在的真实事物纽波特敞篷工程公司(NewportConvertibleEngineering)透露了其最新的汽车手术技术:特斯拉Model3敞篷车。不要调整眼睛。您会注意到,特斯拉本身……这是法拉利特别项目中的11辆车2009年:P540超快Aperta基于599GTBFiorano,特殊项目计划最早的郊游之一是基于CarrozzeriaFantuzi为1968年电影TobyDammi……这是经过调整的法拉利488功率超过800bhp您是否查看了新的Ferrari488Pista的数据并认为是ldquo;嗯rdquo;?不,你当然没有。你是个明智的人。您得出的结论是,711bhp足够用于公路车,然后继续行驶……皮肤被晒伤通红疼痛该怎么办?夏天很多人都喜欢去室外活动,比如海边旅游或者游泳,此时如果我们也没有做好防晒护理的话,很容易被太阳晒伤。晒伤以后皮肤会出现发红、发痒,还可能会出现疼痛,甚至还会出现严重的出现皮……尼康vlog相机Z30上手体验轻巧简单尼康目前Z卡口拥有三款DX格式也就是APSC画幅的微单相机,包括复古、颜值赛高的Zfc,各方面较为均衡的Z50,接下来就是适合入门用户、vlog视频向的Z30了。主要规格……绝绝子!美记休斯顿火箭对自由球员杰伦史密斯有意今年的选秀大会已于上周五结束,假如说季后赛是争冠球队的表演舞台,那么选秀大会则是成绩糟糕球队的表演舞台。是的,备受球迷关注和喜爱的休斯顿火箭正处于重建阶段,过去两个赛季,他们的……
探索越南最美的海角,欣赏壮丽的自然风光,享受大自然的鬼斧神工探索越南最美丽的4个海角,在这里欣赏壮丽的自然风光,享受大自然的鬼斧神工。那么你知道几个?去过哪里?下面就让我们一起来探索越南这些美丽的海角吧!1。龙鳞岩(平定)……看到坟墓入口处孟婆汤阴凉处更孤独看到坟墓那是我们通向另一世界的唯一入口没有什么能把,那个入口给封死感恩上苍,那个茅草呜咽的入口很公平的,给我们每个生者以一次性进入的机会……手残党都可以学会的内双眼线,附教程为什么我说这个眼线特别适合手残党的姐妹,一是因为简单,很容易就学会了,二是光画眼线不画眼影也不会觉得很奇怪,一整个邻家妹妹的淡颜感!如果还想了解更多护肤、化妆知识,修身养颜知识……睡前一小时不看手机,睡眠质量变好了据相关机构调查显示,73的受调查者有睡眠质量问题,此外,83的受调查者睡前1小时在看手机,这些人中,有睡眠质量问题的比例更高。在此建议大家睡前1小时不要看手机。睡前原本应……励志语录好好努力吧,等你优秀了,你想要的都会来找你励志语录Feb17(1)时间在不断筛选你身边的人和事不会有人永远陪你但永远会有人陪你(2)Feb。17水不动就是死水,人不动就是废人。……人世间演员打了多少浓妆女明星的脸?给你们看看啥叫女人央视放出的这部年代大剧《人世间》绝对是当下最火热的电视剧,没有之一的那种,不仅收视率节节高升,全程轻松破1。口碑更是好到爆炸,评论区已经被好评攻陷,李路导演自《人民的名义……励志语录做了就不要后悔,不做才后悔励志语录Feb16(1)Ws生活只有10是事情,剩下90是对待事情的态度,人生总要有所坚持。(2)努力,不只是为了要赚多少钱,更多的时……一种新型带娃方式正在流行老人不累子女感恩,婆媳矛盾越来越少文小雪妈妈现如今老人带娃已经属于普遍现象,因为孩子爸妈基本上都是双职工,需要两个人赚钱才能够支撑起家庭的开支。有老人帮忙带娃,子女压力也没那么大,能够腾出更多的时间……官宣!赛季报销!19岁天才,可惜了事情大概是这样,今天雷霆主帅戴格诺特接受了采访,然后在采访里表示,因为臀部伤病影响,球队新秀约什吉迪将缺席本赛季剩余的所有比赛,换言之,赛季报销。吉迪的伤病发生在上个月末……北京远郊密云区司马台长城推荐指数:景点名片国家AAAA级旅游景区、全国重点文物保护单位、爱国主义教育基地、世界文化遗产地理位置密云区,隶属北京市。位于北京市东北部,介于北纬40137……明略被曝大裁员,吉利收购魅族,马斯克星舰迈出重要一步日报君发自凹非寺量子位公众号QbitAI今天是星期二,六月在不知不觉中已经快过半了。科技圈还有哪些值得关注的新消息?一起来看今日大新闻吉利子公司拟收购魅……曾两次被格林踢裆教育,灰熊中锋亚当斯G3或迎来复出据NBA官方报道,孟菲斯灰熊队中锋史蒂文亚当斯已经解除了健康与安全协议,参加了球队的训练。之前由于触发了健康与安全协议,亚当斯缺席了季后赛首轮最后一场比赛以及与勇士的前两……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网