Introdução às funções de string R

A linguagem R ou R String Functions é majoritariamente implícita para representação gráfica dos dados, análise estatística dos dados e relatórios. é um idioma de código aberto. a convenção de nomenclatura desse idioma foi derivada das primeiras letras dos fundadores desse idioma: Ross Ihaka e Robert Gentleman. É uma linguagem de programação interpretada. Ele tem a capacidade de integrar-se a vários outros procedimentos de linguagem, como C ++, Python, etc. Atualmente, R é a linguagem de programação mais usada no mundo.

Recursos das funções de seqüência de caracteres R

Os principais recursos da linguagem R são os seguintes,

  • Uma linguagem estatística finamente desenvolvida e muito simples.
  • O armazenamento e a manipulação de dados são incorporados de forma muito eficiente ao R.
  • Oferece um grande conjunto de ferramentas classificadas que ajudam na análise de dados
  • R também oferece bibliotecas para obter representações gráficas dos dados

Manipulação de funções de string R

Abaixo é fornecida a lista de funções de manipulação de string R.

1. Grep () nas funções de string R

Usado para corresponder a um padrão nos dados e substituir o padrão por uma sequência diferente. A função grep pode ser expressa de várias maneiras nas linguagens R são regexpr, gregexpr grep, grepl e regexec.

Ex: grep (padrão, x, ignorar. Caso = FALSO, perl = FALSO, valor = FALSO, fixo = FALSO, use Bytes = FALSO, inverter = FALSO)

Argumentos:

  • Padrão - sequência de caracteres contendo uma expressão usual que deve ser igual ao vetor de caractere fornecido.
  • X, Texto - Um objeto que pode ser limitado como um caractere a um vetor de caracteres.
  • Ignorar. Case - (False - a correspondência de padrões funciona sem distinção entre maiúsculas e minúsculas, True - a correspondência de padrões funciona com distinção entre maiúsculas e minúsculas)
  • Perl - Para determinar expressões compatíveis com Perl, especialmente regexprns devem ser usados.
  • Valor - se uma correspondência encontrada retornar verdadeiro ou falso,
  • Use Bytes - Se TRUE depois disso, a correspondência será feita byte a byte em vez de caractere por caractere.
  • Inverter - Retorna índices se True,
  • Substituição - A cadeia de substituição,

2. Nchar ()

Usado para contar o número de caracteres em um vetor. Pega um vetor no formato de sequência como argumento e retorna outro vetor numérico que mantém a contagem da sequência.

Ex: nchar (x, tipo = "caracteres", allowNA = FALSE, keepNA = NA)

Argumentos:

  • X - sequência de vetores.
  • Tipo - Tipo, da cadeia de caracteres, os três mais comuns mencionados são ("bytes", "caracteres", "largura").
  • AllowNA - Representa se o 'Não aplicável' pode ser retornado como saída.
  • KeepNA - 'Não aplicável' deve ser retornado quando X não for encontrado.

3.Substr ()

Usado para escolher o valor de substring do vetor de caracteres.

Ex: substr (x, iniciar, parar)

Argumentos:

  • X, texto - a sequência de caracteres do vetor.
  • Iniciar, Primeiro - inteiro. Início do elemento que se espera que seja substituído
  • Parar, Último - inteiro. aqui a substituição é feita no final da string

4. strsplit () em Funções de String R

Usado para dividir uma sequência de vetores existente em várias substrings de acordo com as correspondências de substring encontradas dentro deles

Ex: strsplit (x, divisão, fixo = FALSE, perl = FALSE, useBytes = FALSE)

Argumentos:

  • X - vetor de caracteres que será citado.
  • Split - vetor de caracteres que atua como separador.
  • Fixed - Faz uma divisão igual quando é passado como true
  • Perl - Regexps compatíveis com Perl devem ser usados?
  • UseBytes - Quando passado como true, dispara a correspondência de byte a byte, em vez de caractere por correspondência de caracteres

5. Regexpr ()

Mais do que grep, o regexpr fornece o índice onde uma correspondência válida é iniciada e o comprimento da string correspondente quando nenhuma correspondência é encontrada. -1 valor é retornado.

Ex: regexpr (padrão, texto, ignore.case = FALSE, perl = FALSE, corrigido = FALSE, useBytes = FALSE)

Argumentos:

  • Padrão - sequência de caracteres que contém uma expressão usual que deveria ser igual ao vetor de caracteres fornecido.
  • X - vetor de caracteres
  • Ignore.case - (Falso - a correspondência de padrões funciona sem distinção entre maiúsculas e minúsculas, True - Patter com correspondência de maiúsculas e minúsculas)
  • Perl - Para determinar expressões compatíveis com Perl, especialmente regexprns deve ser usado
  • Valor - se uma correspondência encontrada retornar verdadeiro, senão falso
  • UseBytes - Se TRUE depois disso, a correspondência será feita byte a byte em vez de caractere por caractere.
  • Inverter - Retorna índices se True

6. Gregexpr () em funções de string R

O gregexpr fornece retorna uma lista de comprimento semelhante como um texto, cujo elemento tem uma forma semelhante ao valor de retorno para regexpr, exceto que as posições preliminares de cada correspondência (disjunta) são fornecidas.

Sintaxe: gregexpr (padrão, texto, ignore.case = FALSE, perl = FALSE, corrigido = FALSE, useBytes = FALSE, extrair = FALSE)

Argumentos:

  • Padrão - sequência de caracteres contendo uma expressão usual que deve ser igual ao vetor de caractere fornecido.
  • X - vetor de caracteres
  • Ignore.case - (Falso - a correspondência de padrões funciona sem distinção entre maiúsculas e minúsculas, True - a correspondência de padrões funciona com distinção entre maiúsculas e minúsculas)
  • Perl - Para determinar expressões compatíveis com Perl, especialmente regexprns deve ser usado
  • Valor - se uma correspondência encontrada retornar verdadeiro, senão falso
  • UseBytes - Se TRUE depois disso, a correspondência será feita byte a byte em vez de caractere por caractere.
  • Inverter - Retorna índices se True
  • Extrair - Quando uma indicação lógica é correspondida, uma extração da substring é feita e retornada

7. Regexec ()

O regexec () no R String Functions é muito semelhante ao regexpr (), exceto aqui os índices entre parênteses e as subexpressões correspondentes são retornadas

Sintaxe: regexec (padrão, texto, ignore.case = FALSE, perl = FALSE, corrigido = FALSE, useBytes = FALSE)

Argumentos:

  • Padrão - sequência de caracteres contendo uma expressão usual que pode ser igual ao vetor de caracteres fornecido.
  • X - vetor de caracteres
  • Ignore.case - (Falso - a correspondência de padrões funciona sem distinção entre maiúsculas e minúsculas, True - Patter com correspondência de maiúsculas e minúsculas)
  • Perl - Para determinar expressões compatíveis com Perl, especialmente regexprns deve ser usado
  • Valor - Se uma correspondência encontrada retornar verdadeiro, senão falso
  • UseBytes - Se TRUE depois disso, a correspondência será feita byte a byte em vez de caractere por caractere.
  • Inverter - Retorna índices se True

Artigos recomendados

Este foi um guia para as funções de seqüência de caracteres R. Aqui discutimos o conceito, recursos, manipulação de funções de string R com exemplo e argumentos. Você também pode acessar nossos outros artigos sugeridos para saber mais -

  1. Funções de string JavaScript
  2. Funções de String do Oracle
  3. Funções de seqüência de caracteres T-SQL
  4. Funções de cadeia de caracteres VBScript
  5. Funções de Regex em Python (Exemplo)