misc:佐々木高政:和文英訳の修業:予備編:文例数について

misc:佐々木高政:和文英訳の修業:予備編:文例数について

章をキーとする昇順の文例数

各章の文例番号の数をまとめてみた。 ただしこれは文例番号の数であって文の数ではなく、一つの文例番号に複数の文がまとめられているか否かを考慮していない。

「助動詞」の8章、「不定詞」の11章、「前置詞」の20章に多くの文例が配置されており、全20章の文例番号数500のうちおおよそ1/4にあたる文例番号の数(139)がこの3章分に割り振られている。

chapter| num|   %   |
--------
  [ 1] |  8 |   1.6 | ****
  [ 2] | 24 |   4.8 | ************
  [ 3] | 16 |   3.2 | ********
  [ 4] | 19 |   3.8 | *********
  [ 5] | 18 |   3.6 | *********
  [ 6] | 10 |   2.0 | *****
  [ 7] | 21 |   4.2 | **********
  [ 8] | 43 |   8.6 | *********************
  [ 9] | 24 |   4.8 | ************
  [10] | 20 |   4.0 | **********
  [11] | 52 |  10.4 | **************************
  [12] | 33 |   6.6 | ****************
  [13] | 19 |   3.8 | *********
  [14] | 29 |   5.8 | **************
  [15] | 13 |   2.6 | ******
  [16] | 31 |   6.2 | ***************
  [17] | 21 |   4.2 | **********
  [18] | 23 |   4.6 | ***********
  [19] | 32 |   6.4 | ****************
  [20] | 44 |   8.8 | **********************

各章の文例を順に暗記していくならば、その進捗状況は次のとおりである。

awk -f diff.awk examples.dat  | awk -f show-star-acc-version.awk         
chapter| num| acc(%)|
--------
  [ 1] |  8 |   1.6 |
  [ 2] | 24 |   6.4 | ***
  [ 3] | 16 |   9.6 | ****
  [ 4] | 19 |  13.4 | ******
  [ 5] | 18 |  17.0 | ********
  [ 6] | 10 |  19.0 | *********
  [ 7] | 21 |  23.2 | ***********
  [ 8] | 43 |  31.8 | ***************
  [ 9] | 24 |  36.6 | ******************
  [10] | 20 |  40.6 | ********************
  [11] | 52 |  51.0 | *************************
  [12] | 33 |  57.6 | ****************************
  [13] | 19 |  61.4 | ******************************
  [14] | 29 |  67.2 | *********************************
  [15] | 13 |  69.8 | **********************************
  [16] | 31 |  76.0 | *************************************
  [17] | 21 |  80.2 | ****************************************
  [18] | 23 |  84.8 | ******************************************
  [19] | 32 |  91.2 | *********************************************
  [20] | 44 | 100.0 | *************************************************

このグラフから読み取ることができる情報を簡単にまとめてみよう。

文例数順(昇順)

awk -f diff.awk examples.dat  | sort -k 2 | awk -f show-star.awk      
chapter| num|   %   |
--------
  [ 1] |  8 |   1.6 | ****
  [ 6] | 10 |   2.0 | *****
  [15] | 13 |   2.6 | ******
  [ 3] | 16 |   3.2 | ********
  [ 5] | 18 |   3.6 | *********
  [ 4] | 19 |   3.8 | *********
  [13] | 19 |   3.8 | *********
  [10] | 20 |   4.0 | **********
  [ 7] | 21 |   4.2 | **********
  [17] | 21 |   4.2 | **********
  [18] | 23 |   4.6 | ***********
  [ 2] | 24 |   4.8 | ************
  [ 9] | 24 |   4.8 | ************
  [14] | 29 |   5.8 | **************
  [16] | 31 |   6.2 | ***************
  [19] | 32 |   6.4 | ****************
  [12] | 33 |   6.6 | ****************
  [ 8] | 43 |   8.6 | *********************
  [20] | 44 |   8.8 | **********************
  [11] | 52 |  10.4 | **************************
awk -f diff.awk examples.dat  | sort -k 2 | awk -f show-star-acc-version.awk
chapter| num| acc(%)|
--------
  [ 1] |  8 |   1.6 |
  [ 6] | 10 |   3.6 | *
  [15] | 13 |   6.2 | ***
  [ 3] | 16 |   9.4 | ****
  [ 5] | 18 |  13.0 | ******
  [ 4] | 19 |  16.8 | ********
  [13] | 19 |  20.6 | **********
  [10] | 20 |  24.6 | ************
  [ 7] | 21 |  28.8 | **************
  [17] | 21 |  33.0 | ****************
  [18] | 23 |  37.6 | ******************
  [ 2] | 24 |  42.4 | *********************
  [ 9] | 24 |  47.2 | ***********************
  [14] | 29 |  53.0 | **************************
  [16] | 31 |  59.2 | *****************************
  [19] | 32 |  65.6 | ********************************
  [12] | 33 |  72.2 | ************************************
  [ 8] | 43 |  80.8 | ****************************************
  [20] | 44 |  89.6 | ********************************************
  [11] | 52 | 100.0 | **************************************************

文例数順(降順)

awk -f diff.awk examples.dat  | sort -k 2 -r | awk -f show-star.awk
chapter| num|   %   |
--------
  [11] | 52 |  10.4 | **************************
  [20] | 44 |   8.8 | **********************
  [ 8] | 43 |   8.6 | *********************
  [12] | 33 |   6.6 | ****************
  [19] | 32 |   6.4 | ****************
  [16] | 31 |   6.2 | ***************
  [14] | 29 |   5.8 | **************
  [ 9] | 24 |   4.8 | ************
  [ 2] | 24 |   4.8 | ************
  [18] | 23 |   4.6 | ***********
  [17] | 21 |   4.2 | **********
  [ 7] | 21 |   4.2 | **********
  [10] | 20 |   4.0 | **********
  [13] | 19 |   3.8 | *********
  [ 4] | 19 |   3.8 | *********
  [ 5] | 18 |   3.6 | *********
  [ 3] | 16 |   3.2 | ********
  [15] | 13 |   2.6 | ******
  [ 6] | 10 |   2.0 | *****
  [ 1] |  8 |   1.6 | ****
awk -f diff.awk examples.dat  | sort -k 2 -r | awk -f show-star-acc-version.awk
chapter| num| acc(%)|
--------
  [11] | 52 |  10.4 | *****
  [20] | 44 |  19.2 | *********
  [ 8] | 43 |  27.8 | *************
  [12] | 33 |  34.4 | *****************
  [19] | 32 |  40.8 | ********************
  [16] | 31 |  47.0 | ***********************
  [14] | 29 |  52.8 | **************************
  [ 9] | 24 |  57.6 | ****************************
  [ 2] | 24 |  62.4 | *******************************
  [18] | 23 |  67.0 | *********************************
  [17] | 21 |  71.2 | ***********************************
  [ 7] | 21 |  75.4 | *************************************
  [10] | 20 |  79.4 | ***************************************
  [13] | 19 |  83.2 | *****************************************
  [ 4] | 19 |  87.0 | *******************************************
  [ 5] | 18 |  90.6 | *********************************************
  [ 3] | 16 |  93.8 | **********************************************
  [15] | 13 |  96.4 | ************************************************
  [ 6] | 10 |  98.4 | *************************************************
  [ 1] |  8 | 100.0 | *************************************************

集計用データとスクリプト

./examples.dat

1 1 8
2 9 32
3 33 48
4 49 67
5 68 85
6 86 95
7 96 116
8 117 159
9 160 183
10 184 203
11 204 255 
12 256 288
13 289 307
14 308 336
15 337 349
16 350 380
17 381 401
18 402 424
19 425 456
20 457 500

./diff.awk

{
    printf("%02d %02d\n", $0, $3-$2+1)
}

./show-star.awk

function rep_str(str, num) {
    result = "";
    for (i = 1; i <= num; i++) {
        result = result str;
    }
    return result;
}

BEGIN {
    print "chapter| num|   %   |";
    print "--------";
}

{
    acc = $2 / 500 * 100;
    printf("  [%2d] | %2d | %5.1f | %s\n", $1, $2, acc, rep_str("*", $2 / 2));
}

./show-star-acc-version.awk

function rep_str(str, num) {
    result = "";
    for (i = 1; i <= num; i++) {
        result = result str;
    }
    return result;
}

BEGIN {
    print "chapter| num| acc(%)|";
    print "--------";
    acc = 0;
}

{
    acc += $2 / 500 * 100;
    printf("  [%2d] | %2d | %5.1f | %s\n", $1, $2, acc, rep_str("*", acc / 2));
}

Last modified : 2014/02/28 13:57:57 JST