tfwh-0.3.7.0

Safe HaskellSafe
LanguageHaskell2010

TFwH.CommonWords

Description

頻出単語

Synopsis

Documentation

type Text = [Char] Source #

テキストの型

type Word = [Char] Source #

単語の型

commonWords :: Int -> Text -> String Source #

commonWords n はテキストから頻出単語の出現回数の上位 n 個の単語を出現回数とともに表示するための文字列を生成する.

commonWords n = unlines      -- 連結する
              . map showRun  -- 単語と出現回数をを表示する文字列を生成する
              . take n       -- 上位 n 個を取り出す
              . sortRuns     -- 出現回数順でソートする
              . countRuns    -- 出現回数を数えて単語と出現回数を対にする
              . sortWords    -- 単語をソートする
              . words        -- テキストを単語に分解
              . map toLower  -- テキストの文字をすべて小文字にする

sortWords :: [Word] -> [Word] Source #

単語をソートする

countRuns :: [Word] -> [(Int, Word)] Source #

出現回数を数えて単語と出現回数を対にする

sortRuns :: [(Int, Word)] -> [(Int, Word)] Source #

出現回数順でソートする

showRun :: (Int, Word) -> String Source #

単語と出現回数をを表示する文字列を生成する