text_tokenize.rtext

string

regex expressing where to cut see (see <a rd-options="base" href="/link/grep?package=rtext&version=0.1.22&to=base" data-mini-rdoc="base::grep">grep</a>)

regex

whether or not reges should be case sensitive
(see <a rd-options="base" href="/link/grep?package=rtext&version=0.1.22&to=base" data-mini-rdoc="base::grep">grep</a>)

ignore.case

whether or not regex should be interpreted as is or as regular
expression (see <a rd-options="base" href="/link/grep?package=rtext&version=0.1.22&to=base" data-mini-rdoc="base::grep">grep</a>)

fixed

whether or not Perl compatible regex should be used
(see <a rd-options="base" href="/link/grep?package=rtext&version=0.1.22&to=base" data-mini-rdoc="base::grep">grep</a>)

perl

byte-by-byte matching of regex or character-by-character
(see <a rd-options="base" href="/link/grep?package=rtext&version=0.1.22&to=base" data-mini-rdoc="base::grep">grep</a>)

useBytes

should information for non-token, i.e. those patterns by
which the text was splitted, be returned as well

non_token

For natural language processing and analysis of qualitative text
coding structures which provide a way to bind together text and text data
are fundamental. The package provides such a structure and accompanying
methods in form of R6 objects. The 'rtext' class allows for text handling
and text coding (character or regex based) including data updates on
text transformations as well as aggregation on various levels.
Furthermore, the usage of R6 enables inheritance and passing by reference
which should enable 'rtext' instances to be used as back-end for R based
graphical text editors or text coding GUIs.

Peter Meissner

rtext

R6 Objects for Text and Data

Ulrich Sieberer

University of Konstanz 

text_tokenize.rtext function

regex expressing where to cut see (see <a rd-options='base' href='grep'>grep</a>)

whether or not reges should be case sensitive
(see <a rd-options='base' href='grep'>grep</a>)

whether or not regex should be interpreted as is or as regular
expression (see <a rd-options='base' href='grep'>grep</a>)

whether or not Perl compatible regex should be used
(see <a rd-options='base' href='grep'>grep</a>)

byte-by-byte matching of regex or character-by-character
(see <a rd-options='base' href='grep'>grep</a>)

text_tokenize.rtext: function tokenizing rtext objects

Description

Usage

Arguments