• 技术文章 >Python技术 >Python基础教程

    python 怎么调用R

    爱喝马黛茶的安东尼爱喝马黛茶的安东尼2019-09-21 17:51:53原创8304

    如何在python中调用R?这其中包括了如何调用R的对象(函数和包),R和python的对象如何互相转换,以及如何调用R的脚本(外界参数的输入)。python提供了一个模块rpy2,可以较好地完成这项工作。

    一、安装rpy2

    rpy2的网址:http://rpy.sourceforge.net/index.html

    可以使用easy_install安装,# easy_install rpy2

    注意事项:

    (1)如果是源代码编译安装R,需要在configure步骤加入后缀 --enable-R-shlib。

    (2)需要安装python-devel包。

    二、python调用R对象

    1、使用rpy2.robjects包的r对象

    调用方法如下,以下robject.r的调用方法实际上是开启了一个R的交互进程,只需要将R的代码写入一个字符串内(注1),接着调用R即可:

    import rpy2.robjects as robjects

    此时,有三种方法调用R对象:

    第一种:robjects.r['pi']

    第二种:robjects.r('pi')(这种方法从某种程度上讲是万能的,因为可以将任意大小和长度的R代码写成一个python字符串,之后通过robjects.r('Rcode')调用执行。)

    第三种:robjects.r.pi(这种方法对于名称中有“点号”的变量会出问题,比如data.frame/read.csv等,所以推荐使用第一种方法)

    相关推荐:《Python教程

    以下是一个创建和使用R函数(自己创建的函数或者R内置函数)。注意:最后一种方法,对于对付一些特殊的格式很管用:

    # creat an R function
    >>> robjects.r(
               '''
               f <- function(r){pi * r}
       .       '''
               )
    >>> robjects.r['f'](3)
    [9.424778]
    # internal function in R
    >>> robjects.r['ls']()
    # another internal function
    >>> l = robjects.r['letters']
    >>> len(l)
    >>> robjects.r['paste'](l, collapse = '-')
    # an alternative way of getting 'paste' function in R
    # eval the R code
    >>> coder = 'paste(%s, collapse = "-")' % (l.r_repr())
    >>> robjects.r(coder)

    对于一些特殊的R对象比如list和matrix,如果python要调去其中的部分数据,可以通过其rx()和rx2()方法操作。对于list,可以查看其name属性,以获得列表个个元素名称。rx()和相当于"["操作(注意取出的是R的list对象),而rx2()相当于"[["操作。一个例子:

    >>> tmp = r("list(a = matrix(1:10, nrow = 2), b = 'Hello')")
    >>> print tmp
    $a
         [,1] [,2] [,3] [,4] [,5]
    [1,]    1    3    5    7    9
    [2,]    2    4    6    8   10
    $b
    [1] "Hello"
    >>> tmp.names
    <StrVector - Python:0x8afdc8c / R:0x8ce0a70>
    ['a', 'b']
    >>> tmp.rx('a')
    <ListVector - Python:0x8afd86c / R:0x8cf71c0>
    [Matrix]
      a: <class 'rpy2.robjects.vectors.Matrix'>
      <Matrix - Python:0x8b013cc / R:0x97de388>
    [       1,        2,        3, ...,        8,        9,       10]
    >>> tmp.rx(1)
    <ListVector - Python:0x8b010cc / R:0x8cf7100>
    [Matrix]
      a: <class 'rpy2.robjects.vectors.Matrix'>
      <Matrix - Python:0x8b017cc / R:0x97de388>
    [       1,        2,        3, ...,        8,        9,       10]
    >>> tmp.rx2(1)
    <Matrix - Python:0x8b01b4c / R:0x97de388>
    [       1,        2,        3, ...,        8,        9,       10]
    >>> tmp.rx2('a').rx(1, 1) # first element of 'a'
    <IntVector - Python:0x8b01acc / R:0x8cf6fa0>
    [       1]
    >>> tmp.rx2('a').rx(1, True) # first row of 'a'
    <IntVector - Python:0x8b01f2c / R:0x965ffd8>
    [       1,        3,        5,        7,        9]

    注意事项:

    如果函数有警告(warnings),在ipython等IDE上能够执行,但是如果是脚本或者与网页服务器交互,则会产生错误。

    解决办法:

    (1)鲁莽的解决很简单,强行忽略R的警告,options(warn = -1)或者R代码放入函数中suppressWarnings()。

    (2)第二种办法,如果是自己代码中使用了warning()函数,则将warning信息换成字符串,之后单独输出。

    如果R的函数参数用到向量,有两种解决办法:

    (1)使用robject.**Vector()函数(见下)先将python对象转换成R对象,然后带入函数;

    (2)直接使用python对象,一个例子:

    >>> from rpy2.robjects import r
    >>> a = r['matrix'](range(10), nrow = 2)
    >>> print a
         [,1] [,2] [,3] [,4] [,5]
    [1,] 0  2  4  6  8   
    [2,] 1  3  5  7  9

    2、python对象转换成R对象

    通常,可以将python的list对象,转换成为R的vector对象,之后直接使用R函数调用。相应的函数是robjects.StrVector()/robjects.IntVector()/robjects.FloatVector()/robjects.complexVector()/robjects.FactorVector()/robjects.BoolVector()/,这些函数将python列表转化成R的字符/整数/浮点/复数/因子/布尔向量。robjects.ListVector()将python的字典转换成R的列表。

    具体转换可见http://rpy.sourceforge.net/rpy2/doc-2.2/html/vector.html#creating-vectors

    比如:

    >>> testmatrix = robjects.IntVector([1, 2, 3, 4])
    >>> robjects.r['matrix'](testmatrix, nrow = 2)
    # another dynamic arguments example
    >>> x = robjects.IntVector(range(10))
    >>> y = robjects.r.rnorm(10)
    >>> kwargs = {'ylab': 'foo/bar', 'type': 'b', 'col': 'blue', 'log': 'x'}
    >>> robjects.r.plot(*args, **kwargs)
    >>>

    注意事项:

    使用vector系列函数时,输入的只能是python的列表,而不能是数字或者字符串。

    3、载入和使用R包

    使用rpy2.robjects.packages.importr对象,调用方法是

    >>> from rpy2.robjects.packages import importr
    >>> base = importr('base')
    >>> stats = importr('stats')
    >>> affy = importr('affy')
    >>> stats.rnorm(10)
    如果想引用一个包中的隐变量,也很简单,只要载入包,然后所有r命令化成成字符串,之后引用即可(这种方法是万能的),比如
    >>> from rpy2.robjects.packages import importr
    >>> importr('hwriter')
    >>> a = r('hwriter:::hwrite.table(matrix(1:10, 2))')
    >>> print(a)
    [1] "<table border="1">n<tr>n<td>1</td><td>3</td><td>5</td><td>7</td><td>9</td></tr>n<tr>n<td>2</td><td>4</td>
    <td>6</td><td>8</td><td>10</td></tr>n</table>n"

    4、导入R脚本

    使用R的source函数:

    from rpy2.robjects import r
    r.source('testrscript.r')

    5、转换R对象为全局变量

    因为使用函数robjects.globalenv()将对象转换成全局变量,特别是遇到python找不到一个R对象时(此时R对象可能通过r('Rcode')调用),留意将R对象转变成全局变量。

    三、R对象转换成python对象

    推荐使用tuple( )或者list( )函数,将R对象转换成tuple或者list。

    >>> a = r('c(1, 2, 3)')
    >>> a
    <FloatVector - Python:0x904746c / R:0x9114978>
    [1.000000, 2.000000, 3.000000]
    >>> str(a)
    '[1] 1 2 3n'
    >>> tuple(a)
    (1.0, 2.0, 3.0)
    >>> list(a)
    [1.0, 2.0, 3.0]
    >>> b = r('matrix(1:6, 2, 3)')
    >>> b
    <Matrix - Python:0x9039c6c / R:0x9114710>
    [1,2,3,4,5,6]
    >>> print b
         [,1] [,2] [,3]
    [1,]    1    3    5
    [2,]    2    4    6
    >>> tuple(b)
    (1, 2, 3, 4, 5, 6)
    >>> list(b)
    专题推荐:python 调用 r
    上一篇:如何用python创建文件夹 下一篇:Python获取cookie有什么用

    相关文章推荐

    • Python如何调用rar命令• python怎么输出倒序• python怎么输出反斜杠• python怎么安装扩展包

    全部评论我要评论

    © 2021 Python学习网 苏ICP备2021003149号-1

  • 取消发布评论
  • 

    Python学习网