Learn R Programming

⚠️There's a newer version (0.7-17) of this package.Take me there.

tm (version 0.7-16)

Text Mining Package

Description

A framework for text mining applications within R.

Copy Link

Version

Install

install.packages('tm')

Monthly Downloads

40,028

Version

0.7-16

License

GPL-3

Maintainer

Kurt Hornik

Last Published

February 19th, 2025

Functions in tm (0.7-16)

Uniform Resource Identifier Source

Weighting Function

Volatile Corpora

Combine Corpora, Documents, Term-Document Matrices, and Term Frequency Vectors

ZIP File Source

50 Exemplary News Articles from the Reuters-21578 Data Set of Topic acq

XMLTextDocument

XML Text Documents

Explore Corpus Term Frequency Characteristics

Inspect Objects

Find Frequent Terms

Read Document-Term Matrices

getTransformations

Transformations

findMostFreqTerms

Find Most Frequent Terms

Parallelized ‘lapply’

Find Associations in a Term-Document Matrix

content_transformer

Content Transformers

20 Exemplary News Articles from the Reuters-21578 Data Set of Topic crude

Read In a Text Document

Read In a Reuters Corpus Volume 1 Document

readReut21578XML

Read In a Reuters-21578 XML Document

Read In a MS Word Document

Visualize a Term-Document Matrix

Read In a POS-Tagged Word Text Document

Read In a Text Document from a Data Frame

TermDocumentMatrix

Term-Document Matrix

Metadata Management

Read In a PDF Document

Term Frequency Vector

stripWhitespace

Strip Whitespace from a Text Document

Read In an XML Document

removePunctuation

Remove Punctuation Marks from a Text Document

Remove Numbers from a Text Document

removeSparseTerms

Remove Sparse Terms from a Term-Document Matrix

Remove Words from a Text Document

Compute Score for Matching Terms

Write a Corpus to Disk

Weight by Term Frequency - Inverse Document Frequency

Filter and Index Functions on Corpora

Combine Transformations

SMART Weightings

Transformations on Corpora

Weight by Term Frequency

Directory Source

Access Document IDs and Terms

DataframeSource

Data Frame Source

Permanent Corpora

PlainTextDocument

Plain Text Documents