Introducción a R

R es un lenguaje y un entorno para la computación y los gráficos estadísticos. R proporciona una amplia variedad de estadísticas (modelado lineal y no lineal, pruebas estadísticas clásicas, análisis de series de tiempo, clasificación, agrupamiento,…), técnicas gráficas, paquetes de aprendizaje automático y es altamente extensible.

Uno de los puntos fuertes de R es la facilidad con la que se pueden producir gráficos con calidad de publicación bien diseñados, incluidos símbolos matemáticos y fórmulas cuando sea necesario. Se ha tenido mucho cuidado con los valores predeterminados para las opciones de diseño menores en los gráficos, pero el usuario conserva el control total.

El entorno R

R es un conjunto integrado de instalaciones de software para la manipulación, el cálculo y la visualización gráfica de datos. Incluye:

• una instalación eficaz de manejo y almacenamiento de datos,

• un conjunto de operadores para cálculos en matrices, en particular matrices,

• una colección amplia, coherente e integrada de herramientas intermedias para el análisis de datos,

• facilidades gráficas para el análisis de datos y visualización en pantalla o en papel, y

• un lenguaje de programación bien desarrollado, simple y efectivo que incluye condicionales, bucles, funciones recursivas definidas por el usuario e instalaciones de entrada y salida.

Usando R con MariaDB

R Instalación

Algunas nociones / consejos básicos sobre cómo usar R junto con MariaDB son los siguientes:

R. La distribución de R recomendada es “Microsoft R Open”: MRAN

B. Las GUI de R recomendadas son RStudio Desktop o RStudio Server: RStudio

Las GUI alternativas serían:

“Microsoft R Open” y “MariaDB Server” se pueden instalar en el mismo servidor o en servidores diferentes, ya que se utilizará un protocolo de comunicación ODBC para el intercambio de datos entre los dos entornos.

Transferencia de datos entre R y MariaDB

Paquete: “odbc”

Para la transferencia de datos entre el servidor MariaDB y el entorno R, se recomienda el paquete “odbc” de R: CRAN odbc

  • “Odbc” es un nuevo paquete R disponible en CRAN (desde 2017-02-05) y mantenido por RStudio, que está diseñado para cumplir con la especificación DBI.

El paquete “odbc” requiere haber instalado previamente el conector ODBC de MariaDB o MySQL:

Para instalar el paquete “odbc” de CRAN, ejecute en R:

install.packages("odbc")

Paquete: “RMariaDB”

La biblioteca R “RMariaDB” es un cliente moderno de ‘MariaDB’ basado en ‘Rcpp’.

Para instalar el paquete RMariaDB a través de CRAN, ejecute la siguiente instrucción R:

install.packages("RMariaDB")

Y para conectarse a MariaDB:

library(RMariaDB)

con <- dbConnect(
  drv = RMariaDB::MariaDB(), 
  username =NULL,
  password =NULL, 
  host =NULL, 
  port =3306)

Otros paquetes: “readr”, “RODBC”

Hay otras alternativas para la transferencia de datos entre R y MariaDB:

  • Paquete “readr” R, para escribir / leer archivos CSV. Para ser utilizado en MariaDB junto con “LOAD DATA INFILE”.
  • Paquete “RODBC” R: Paquete robusto y probado (desde 2000-05-24) que permite la transferencia de datos entre R y MariaDB mediante un conector ODBC: GRÚA RODBC
    • Es un poco más lento que el nuevo paquete “odbc” de RStudio (ver puntos de referencia): RStudio odbc
    • Para informar de errores al responsable del paquete RODBC, utilice la siguiente declaración de R: bug.report (package = “RODBC”)
    • Puede encontrar una viñeta sobre cómo usar el paquete RODBC aquí: Viñeta RODBC CRAN

Recursos de programación de R

A) Programación

Los recursos recomendados para aprender a programar en R son los siguientes:

Puede encontrar un extracto de los libros aquí:

B) Estadísticas

Un libro recomendado para comprender las estadísticas subyacentes en los paquetes R es:

C) Cheatsheets: Resumen de conceptos

D) Motor de búsqueda y paquete R destacado

E) Aprendizaje automático estadístico / no supervisado, aprendizaje profundo e inteligencia artificial

H2O.AI

El lenguaje de programación R tiene soporte para la biblioteca H2O.ai (h2o), que permite crear modelos de aprendizaje automático impulsados ​​por GPU de varios clústeres en memoria.

Para instalar H2O.ai a través de CRAN, ejecute:

install.packages("h2o")

Las siguientes declaraciones de R se pueden usar para importar una tabla MariaDB a H2O.ai usando R Front End:

  • import_sql_table: “Esta función importa una tabla SQL a H2OFrame en la memoria”.
  • import_sql_select: “Esta función importa la tabla SQL que es el resultado de la consulta SQL especificada a H2OFrame en la memoria”.
connection_url <-"jdbc:mariadb://172.16.2.178:3306/ingestSQL?&useSSL=false"
username <-"root"
password <-"abc123"# Whole Table:table<-"citibike20k"
my_citibike_data <- h2o.import_sql_table(connection_url,table, username, password)# SELECT Query:
select_query <-"SELECT  bikeid  FROM citibike20k"
my_citibike_data <- h2o.import_sql_select(connection_url, select_query, username, password)

NOTA: Asegúrese de iniciar h2o.jar en la terminal con su controlador JDBC descargado en la ruta de clase:

java -cp <path_to_h2o_jar>:<path_to_jdbc_driver_jar> water.H2OApp

KERAS

R paquete keras ofrece una interfaz para ‘Keras’ de Python, una ‘API’ de redes neuronales de alto nivel.

‘Keras’ se desarrolló con un enfoque en permitir una experimentación rápida, admite redes basadas en convolución y redes recurrentes (así como combinaciones de las dos) y se ejecuta sin problemas tanto en dispositivos de ‘CPU’ como de ‘GPU’.

BIBLIOTECAS R: CARET

Un libro que presenta los conceptos básicos del aprendizaje automático:

F) Minería de textos

La documentación sobre cómo realizar minería de texto en R se puede encontrar en el libro “Minería de texto con R”:

G) Aplicaciones web brillantes y documentos RMarkdown

APLICACIONES WEB BRILLANTES

Brillante R Package hace que sea increíblemente fácil crear aplicaciones web interactivas con R.

La vinculación “reactiva” automática entre entradas y salidas y los extensos widgets prediseñados permiten crear aplicaciones atractivas, con capacidad de respuesta y potentes con un esfuerzo mínimo.

Para implementar aplicaciones web Shiny usando alternativas de código abierto, puede usar:

DOCUMENTOS DE RMARKDOWN

H) Recursos R avanzados

Algunos de los recursos de R más avanzados para comprender completamente los aspectos internos y los matices del lenguaje de programación R son los siguientes:

El contenido reproducido en este sitio es propiedad de sus respectivos dueños, y MariaDB no revisa este contenido con anticipación. Los puntos de vista, la información y las opiniones expresadas por este contenido no representan necesariamente las de MariaDB o de cualquier otra parte.