The London Perl and Raku Workshop takes place on 26th Oct 2024. If your company depends on Perl, please consider sponsoring and/or attending.

NAME

cat-v - 非表示文字の可視化

SYNOPSIS

cat-v [ オプション ] 引数 ...

  OPTIONS
     -n   --reset         Disable all character conversion
     -c   --visible=#     Specify visualize characters
          --repeat=#      Specify repeat characters
     -t   --expand[=#]    Expand tabs
     -T   --no-expand     Do not expand tabs
    --ts  --tabstyle=#    Set tab style
          --tabstop=#     Set tab width
          --tabhead=#     Set tab-head character
          --tabspace=#    Set tab-space character
     -h   --help          Print this message
     -v   --version       Print version

  OPTIONS FOR EACH CHARACTERS
    --esc                 Enable escape
    --esc=c               Show escape in control format
    --esc=+c              Show escape in control format and reproduce
    --nl=0                Disable newline
    --sp=~                Convert spaces to tilde
    --sp='OPEN BOX'       Unicode name
    --esc=+U+035B         Unicode code point

VERSION

Version 0.9903

DESCRIPTION

cat -v コマンドは表示できない文字を表示するためによく使われますが、全ての非ASCII文字を変換するため、現代のアプリケーションの出力を見るのには常に適しているわけではありません。

cat-v コマンドは空白や制御文字を可視化しながら、表示可能なグラフィック文字の表示を保持します。

また、デフォルトではエスケープ文字は変換されないため、ANSIエスケープシーケンスによる装飾が保持されます。

時には空白文字を可視化したいことがあります。cat -t コマンドはタブ文字を可視化できますが、問題は視覚的なフォーマットを壊してしまうことです。フォーマットを保持しながら、どの部分がタブでどの部分がスペース文字であるかを見たいかもしれません。行末の余分な空白文字も可視化することで気づくことができます。

cat-v を使用すると、表示上のスペースが変わらないようにタブ文字が可視化されます。

制御文字は制御フォーマットとUnicode記号文字で表示することができます。デフォルトでは、改行とエスケープ文字以外の制御文字は対応するUnicode記号として表示されます。

第二フィールドはデフォルトのアクションです。s は記号、m はUnicodeマーク、0 は変換なしを意味します。

    nul   s  \000  \x{2400}  ␀  SYMBOL FOR NULL
    soh   s  \001  \x{2401}  ␁  SYMBOL FOR START OF HEADING
    stx   s  \002  \x{2402}  ␂  SYMBOL FOR START OF TEXT
    etx   s  \003  \x{2403}  ␃  SYMBOL FOR END OF TEXT
    eot   s  \004  \x{2404}  ␄  SYMBOL FOR END OF TRANSMISSION
    enq   s  \005  \x{2405}  ␅  SYMBOL FOR ENQUIRY
    ack   s  \006  \x{2406}  ␆  SYMBOL FOR ACKNOWLEDGE
    bel   s  \007  \x{2407}  ␇  SYMBOL FOR BELL
    bs    s  \010  \x{2408}  ␈  SYMBOL FOR BACKSPACE
    ht    s  \011  \x{2409}  ␉  SYMBOL FOR HORIZONTAL TABULATION
    nl    m  \012  \x{240A}  ␊  SYMBOL FOR LINE FEED
    vt    s  \013  \x{240B}  ␋  SYMBOL FOR VERTICAL TABULATION
    np    m  \014  \x{240C}  ␌  SYMBOL FOR FORM FEED
    cr    s  \015  \x{240D}  ␍  SYMBOL FOR CARRIAGE RETURN
    so    s  \016  \x{240E}  ␎  SYMBOL FOR SHIFT OUT
    si    s  \017  \x{240F}  ␏  SYMBOL FOR SHIFT IN
    dle   s  \020  \x{2410}  ␐  SYMBOL FOR DATA LINK ESCAPE
    dc1   s  \021  \x{2411}  ␑  SYMBOL FOR DEVICE CONTROL ONE
    dc2   s  \022  \x{2412}  ␒  SYMBOL FOR DEVICE CONTROL TWO
    dc3   s  \023  \x{2413}  ␓  SYMBOL FOR DEVICE CONTROL THREE
    dc4   s  \024  \x{2414}  ␔  SYMBOL FOR DEVICE CONTROL FOUR
    nak   s  \025  \x{2415}  ␕  SYMBOL FOR NEGATIVE ACKNOWLEDGE
    syn   s  \026  \x{2416}  ␖  SYMBOL FOR SYNCHRONOUS IDLE
    etb   s  \027  \x{2417}  ␗  SYMBOL FOR END OF TRANSMISSION BLOCK
    can   s  \030  \x{2418}  ␘  SYMBOL FOR CANCEL
    em    s  \031  \x{2419}  ␙  SYMBOL FOR END OF MEDIUM
    sub   s  \032  \x{241A}  ␚  SYMBOL FOR SUBSTITUTE
    esc   0  \033  \x{241B}  ␛  SYMBOL FOR ESCAPE
    fs    s  \034  \x{241C}  ␜  SYMBOL FOR FILE SEPARATOR
    gs    s  \035  \x{241D}  ␝  SYMBOL FOR GROUP SEPARATOR
    rs    s  \036  \x{241E}  ␞  SYMBOL FOR RECORD SEPARATOR
    us    s  \037  \x{241F}  ␟  SYMBOL FOR UNIT SEPARATOR
    sp    m  \040  \x{2420}  ␠  SYMBOL FOR SPACE
    del   s  \177  \x{2421}  ␡  SYMBOL FOR DELETE
    nbsp  s  \240  \x{2423}  ␣  OPEN BOX

この時点で、以下の文字に対してUnicodeマーキングが利用可能です

    nul   \x{2205}  ∅  EMPTY SET
    bel   \x{237E}  ⍾  BELL SYMBOL
    nl    \x{23CE}  ⏎  RETURN SYMBOL
    np    \x{2398}  ⎘  NEXT PAGE
    sp    \x{00B7}  ·  MIDDLE DOT

OPTIONS

-n, --reset

全ての文字変換を無効にし、繰り返し文字をリセットします。

-c, --visible name=flag,...

可視化される文字と変換フォーマットを指定するために、文字タイプとフラグをパラメータとして与えます。

    c  control style
    s  symbol style
    m  Unicode mark (if exists)
    0  do not convert
    *  non-alphanumeric char is used as a replacement

オプション -c nl=1 も使用して改行文字を可視化することができます。改行文字のみ、変換の結果を表示した後、元の文字が同時に出力されます。

上記のリストの名前を使用して、文字タイプごとに指定します。タブを変換せずにエスケープを変換したい場合は、以下を使用します

    cat-v -c tab=0 -c esc=s

複数の項目を同時に指定することができます。以下の例では、tabbel を 0 に設定し、escs に設定します。

    cat-v -c tab=bel=0,esc=s

名前に all が指定された場合、その値は全ての文字タイプに適用されます。以下のコマンドは全ての文字を s に設定し、その後 nlnlnpspm に設定し、esc を無効にします。これがデフォルトの状態です。

    cat-v -c all=s,nul=nl=np=sp=m,esc=0
--name[=replacement]

全ての制御文字は、その名前でオプションを使用してアクセスすることもできます。例えば、改行文字にはオプション --nl が定義されています。

単独で使用すると、その文字の可視性が有効になります。

    cat-v --nl

無効にするには、値 0 を与えます。

    cat-v --nl=0

アルファベットや数字以外の文字が与えられた場合、その文字に置き換えられます。

    cat-v --nl='$'

2文字以上の文字列が与えられた場合、Unicode文字名として解釈されます。

    cat-v --nl='RETURN SYMBOL' --sp='MIDDLE DOT'

フラグが+で始まる場合、その文字は繰り返しリストに追加されます。

    cat -v --esc=+s

したがって、上記のコマンドは、以下のように書いた場合と同じ意味を持ちます。

    cat -v --esc=s --repeat +esc
--repeat=name[,name...]

変換された文字と同時に元の文字を出力するための文字タイプを指定します。デフォルト設定はnl,npです。以下は、エスケープ文字を視覚化した状態で元のANSIシーケンスを正しく出力します。

    cat-v -c esc --repeat esc,nl

name+で始まる場合、既存の設定にその文字を追加します。

    cat-v -c esc --repeat +esc
-t[n], --expand[=n]
-T, --no-expand

タブ文字はデフォルトで展開されます。明示的に無効にするには、-Tまたは--no-expandオプションを使用します。

-t オプションに任意の数値が指定された場合、それはタブ幅として扱われます。以下の二つのコマンドは同等です:

    cat-v -t4
    cat-v -t --tabstop=4

デフォルトでは、スタイル needle が適用されますが、--tabstyle で変更することができます。引数なしで --tabstyle オプションが指定された場合、利用可能なスタイルのリストが表示されます。

~/.cat-vrcファイルに以下の設定を入れることで、デフォルトでタブ展開を無効にすることができます。

    option default --no-expand

そのような場合、-tオプションで一時的にタブ展開を有効にすることができます。

--tabstop=# (DEFAULT: 8)

タブ幅を設定します。

--tabhead=#
--tabspace=#

タブの先頭とそれに続くスペース文字を設定します。オプションの値が単一文字より長い場合、ユニコード名として評価されます。

--tabstyle, --ts
--tabstyle=style, --ts=...
--tabstyle=head-style,space-style --ts=...

タブの展開方法のスタイルを設定します。例えばsymbolshadeを選択します。2つのスタイル名が組み合わされている場合、例えばsquat-arrow,middle-dot、タブの先頭にはsquat-arrowを、タブスペースにはmiddle-dotを使用します。

パラメータなしで呼び出された場合、利用可能なスタイルリストを表示します。スタイルはText::ANSI::Foldライブラリで定義されています。

INSTALL

CPANMINUS

CPANアーカイブから:

    cpanm App::cat::v

GITリポジトリから:

    cpanm https://github.com/tecolicom/App-cat-v.git

SEE ALSO

https://github.com/tecolicom/App-cat-v.git

Gitリポジトリ。

App::optex::util::filter

cat-vコマンドの前身は、もともとApp::optexコマンドのフィルターモジュールとして作成されました。

AUTHOR

Kazumasa Utashiro

LICENSE

Copyright © 2024 Kazumasa Utashiro.

This library is free software; you can redistribute it and/or modify it under the same terms as Perl itself.