data_honey

julia语言做数据预处理

Julia语言数据预处理
本文简单介绍拿Julia语言进行数据预处理，数据R语言和python的都应该有感觉，就是R和python做数据预处理非常方便。R方面主要是有dplyr这个包，或者是datatable这个包。python对应的pandas这个库，因此这几个包极大地促进了数据预处理。juila语言其实在这个方面也是非常强的，因为julia本身就是吸收了python，R，matlab等一系列语言发展而来的，虽然目前还没有太流行，但是未来很有发展潜力。我自己感觉一个很重要的原因就是julia语言在优化领域存在一些非常强劲的包。大家看，python有了numpy，pandas，sciklearn等等，R也有大量的机器学习，以及统计学方面的包，但是呢，这两个软件优化方面的东西还是少了一些，当然也存在这方面的包，比如python有pymo。R也有对应的优化包，但是呢，不是太强劲，我们希望R，python在优化方面也有像机器学习那么强悍的几个包。julia语言弥补了这个不足，它在优化方面非常突出。比matlab要好用很多，当然我们今天不是讲julia在优化方面的应用，主要是做一些数据预处理的工作。

julia这个语言里边核心的数据结构主要是array和DataFrame，数据预处理主要是利用dataframe的一些函数进行

#调用DataFrames包
using Dataframs
#读取csv文件
#设置文件地址
file="D:/Rdata/exercise.csv"
#读取数据
data=readtable(file)
#查看数据的前五行，用head
6×8 DataFrames.DataFrame
│ Row │ weekend │ num_child │ distance │ rides │ games │ wait │ clean │
├─────┼─────────┼───────────┼──────────┼───────┼───────┼──────┼───────┤
│ 1   │ "yes"   │ 0         │ 114.648  │ 87    │ 73    │ 60   │ 89    │
│ 2   │ "yes"   │ 2         │ 27.0141  │ 87    │ 78    │ 76   │ 87    │
│ 3   │ "no"    │ 1         │ 63.301   │ 85    │ 80    │ 70   │ 88    │
│ 4   │ "yes"   │ 0         │ 25.9099  │ 88    │ 72    │ 66   │ 89    │
│ 5   │ "no"    │ 4         │ 54.7183  │ 84    │ 87    │ 74   │ 87    │
│ 6   │ "no"    │ 5         │ 22.6793  │ 81    │ 79    │ 48   │ 79    │

│ Row │ overall │
├─────┼─────────┤
│ 1   │ 47      │
│ 2   │ 65      │
│ 3   │ 61      │
│ 4   │ 37      │
│ 5   │ 68      │
│ 6   │ 27      │
#查看最后五行
tail(data)
6×8 DataFrames.DataFrame
│ Row │ weekend │ num_child │ distance │ rides │ games │ wait │ clean │
├─────┼─────────┼───────────┼──────────┼───────┼───────┼──────┼───────┤
│ 1   │ "no"    │ 5         │ 41.4701  │ 83    │ 84    │ 77   │ 90    │
│ 2   │ "no"    │ 0         │ 11.0526  │ 90    │ 72    │ 68   │ 90    │
│ 3   │ "yes"   │ 0         │ 8.18774  │ 91    │ 83    │ 82   │ 91    │
│ 4   │ "no"    │ 2         │ 45.1774  │ 95    │ 92    │ 85   │ 93    │
│ 5   │ "no"    │ 3         │ 27.0884  │ 83    │ 83    │ 80   │ 88    │
│ 6   │ "no"    │ 1         │ 38.4088  │ 86    │ 88    │ 77   │ 85    │

│ Row │ overall │
├─────┼─────────┤
│ 1   │ 55      │
│ 2   │ 46      │
│ 3   │ 47      │
│ 4   │ 71      │
│ 5   │ 54      │
│ 6   │ 62      │
#若想查看前n行，直接在head里边，加入数字即可，比如查看前十行，就是head(data,10)
#查看数据框中所有变量
names(data)
8-element Array{Symbol,1}:
 :weekend  
 :num_child
 :distance 
 :rides    
 :games    
 :wait     
 :clean    
 :overall  
#查看数据框的维度
size(data)
(500, 8)
#查看每个变量的数据类型


showcols(data)
500×8 DataFrames.DataFrame
│ Col # │ Name      │ Eltype  │ Missing │
├───────┼───────────┼─────────┼─────────┤
│ 1     │ weekend   │ String  │ 0       │
│ 2     │ num_child │ Int64   │ 0       │
│ 3     │ distance  │ Float64 │ 0       │
│ 4     │ rides     │ Int64   │ 0       │
│ 5     │ games     │ Int64   │ 0       │
│ 6     │ wait      │ Int64   │ 0       │
│ 7     │ clean     │ Int64   │ 0       │
│ 8     │ overall   │ Int64   │ 0       │
#从前面来看，貌似julia和R，python很相似，但是在查看数据框中某个变量时，julia用的是：符号，比如要查看weekend变量，如下：
data[:weekend]
500-element DataArrays.DataArray{String,1}:
 "yes"
 "yes"
 "no" 
 "yes"
 "no" 
 "no" 
 "yes"
 "no" 
 "no" 
 "yes"
 ⋮    
 "yes"
 "yes"
 "no" 
 "no" 
 "no" 
 "yes"
 "no" 
 "no" 
 "no" 
 #当然也可以这样data[1],也就是提取第一列，python的话，就是提取第一行，但是julia是提取第一列。
 data[1]
 #如果要是查看多列的话，比如查看weekend和game这两列，就是data[:,[:weekend,:games]]
 data[:,[:weekend,:games]]
 500×2 DataFrames.DataFrame
│ Row │ weekend │ games │
├─────┼─────────┼───────┤
│ 1   │ "yes"   │ 73    │
│ 2   │ "yes"   │ 78    │
│ 3   │ "no"    │ 80    │
│ 4   │ "yes"   │ 72    │
│ 5   │ "no"    │ 87    │
│ 6   │ "no"    │ 79    │
│ 7   │ "yes"   │ 73    │
│ 8   │ "no"    │ 70    │
⋮
│ 492 │ "yes"   │ 87    │
│ 493 │ "yes"   │ 59    │
│ 494 │ "no"    │ 75    │
│ 495 │ "no"    │ 84    │
│ 496 │ "no"    │ 72    │
│ 497 │ "yes"   │ 83    │
│ 498 │ "no"    │ 92    │
│ 499 │ "no"    │ 83    │
│ 500 │ "no"    │ 88    │
#或者是data[:,[1,5]]

上面是对数据进行按列进行的一些操作，如果是对行列同时进行，那就是数据切片了，下面进行介绍

data[1:3,[:weekend,:games]]
3×2 DataFrames.DataFrame
│ Row │ weekend │ games │
├─────┼─────────┼───────┤
│ 1   │ "yes"   │ 73    │
│ 2   │ "yes"   │ 78    │
│ 3   │ "no"    │ 80    │

data[1:3,[1,5]]
3×2 DataFrames.DataFrame
│ Row │ weekend │ games │
├─────┼─────────┼───────┤
│ 1   │ "yes"   │ 73    │
│ 2   │ "yes"   │ 78    │
│ 3   │ "no"    │ 80    │

大家这里要注意到，julia的索引是从1开始的，而不是从0开始的。
好了，继续，刚才是连续取行，比如1:3表示取1到3行，如果是想离散的进行切片，如下

data[[1,3],[1,2]]
2×2 DataFrames.DataFrame
│ Row │ weekend │ num_child │
├─────┼─────────┼───────────┤
│ 1   │ "yes"   │ 0         │
│ 2   │ "no"    │ 1         │

更加多样化的操作大家可以参考如下链接
介绍julia的DataFrame的教程

你怎么想，生活就怎么给你 Hi花小溪
原创：花小溪来自公众号：拾书谈心中午回到公司，同事们正利用午休时间在餐桌上玩牌怡情，四个女人一桌牌，欢笑阵阵，豪放劲儿不输男人。我进去看了一会儿也没怎么懂，JUILA问我能看懂吗？——还真是不太懂，不过算24点我在行。记得小时候的暑假，几个小朋友经常聚集在一起玩纸牌，玩法也好多种，别的都不行，但算24点我常常能赢。CUKIE大美女对我说：XX，我们几个已经约好了，以后老了也要这样一起过（她指打牌）
使用Juila语言求解Unit Commitment 问题辘轳鹿鹿
1.安装Julia在官网中DownloadJulia(julialang.org)下载合适的julia安装包并进行安装image.png安装完成后运行界面如下image.png2.配置IDEVScodeJulia+VSCode-知乎(zhihu.com)安装插件：Julia和coderunner在扩展列表中，右击Julia，选择扩展设置（ExtensionSettings）将Julia:Execu
共读“宁宁的头发事件” 祥云2018
谢谢Juila的精彩分享。我想起了女儿小时候相似的经历，那时女儿还没满3岁，她一个人在桌子边玩，我在其他房间干活，等我下一秒看到她时，她的头发左长右短，非常凌乱，竟然自己把头发剪了。我第一反应是庆幸剪刀没有伤害到她自己，第二反应是哭笑不得，后来我也忘记有没有骂她，估计还是会吓唬她一下，说不能碰剪刀之类的话。在听完分享后，我印象深刻的是大大与战场隔离的方式，不要让持续的怒火失控伤了孩子，在一个人的空
juila调用python的坑 MaYang_ python
今天教了juila相关的东西，也是第一次听说这个语言，但是其中下载包以方便调用python老是出错老师的ppt中的方式适合没有装过ｐｙｔｈｏｎ，因为对于已经使用ａｎａｃｏｎｄａ的要换成ｍｉｎｉｃｏｎｄａ就很难受然后根据官方的方式会报错：https://github.com/JuliaPy/PyCall.jl第一种方式如下（适合已经安装ａｎａｃｏｎｄａ，并且想使用已安装ａｎａｃｏｎｄａ的人）从命令行
Coding and Paper Letter（十六） G小调的Qing歌
资源整理。1Coding:1.Python库whitebox，用于地理空间数据高级分析。另外还有一个是whiteboxtool，可运行的平台exe。whiteboxwhiteboxtools2.R语言包sgd，大规模随机梯度下降法实现。sgd3.亚马逊云（AWS）上的无服务器地图瓦片。servelesstiles4.Juila语言包GeoStats，看完感觉Juila的语法相当舒服。GeoStat
julia语言做数据预处理 data_honey juila
Julia语言数据预处理本文简单介绍拿Julia语言进行数据预处理，数据R语言和python的都应该有感觉，就是R和python做数据预处理非常方便。R方面主要是有dplyr这个包，或者是datatable这个包。python对应的pandas这个库，因此这几个包极大地促进了数据预处理。juila语言其实在这个方面也是非常强的，因为julia本身就是吸收了python，R，matlab等一系列语言
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

julia语言做数据预处理

你可能感兴趣的:(juila)