科学技術のアネクドート

推定総文字数674万字、「科学技術のアネクドート」12周年

写真作者:Eric Fischer

このブログ「科学技術のアネクドート」はきょう(2018年)1月10日(水)で始まりから12周年を迎えました。

ブログの管理者ページには、「いままでに書いた記事 4389件」とあります。では、このブログではいままでに使われた字は何文字になるのでしょう。

インターネットには、貼りつけた文字の数を数えるサイトがあります。また、文書ソフトウェアのワードにも文字数を数えうきのうがあります。しかし、ブログではすべての記事を1スクロールで見られるわけでないため、いちいちコピーして貼りつけていくと長大な時間がかかってしまいます。

厳密な字数を数えることはできないものの、おおよそのブログ総文字数をファイルの情報量から求めることはできます。

ブログの原稿のファイルは、標準テキストファイルで「原稿-ブログ何々」のような名前になっているので、コンピュータで「原稿-ブログ」と検索すれば、ブログ原稿のためのファイルだけを並べることができます。

そしてそれらのファイルをすべてコピーして別のフォルダに入れれば、ブログ原稿のファイルだけを集めることができます。

そしてそのフォルダの「情報を見る」機能でサイズを見れば、すべてのブログ原稿をあわせたデータ容量をみることができます。実際におこなうと、「12,256,168バイト」と出ました。

さて、「バイト」というのは、情報量を示す単位。通常、全角1文字には2バイト、半角1文字には1バイトが使われます。

ブログには、漢字やかななどの全角文字と、参考資料のURL(Uniform Resource Locator)をふくむ英数字が使われています。このブログでは、参考資料のURLが1記事につきいくつか貼られており、ここで半角文字が多く使われます。このことも含めて、1記事の全角文字と半角文字の比率を「9対1」と仮定します。

つまり、12,256,168バイトのうち、9割にあたる11,030,551バイトが2バイトの全角文字に、また1割にあたる1,225,617バイトが1バイトの半角文字に使われているとします。

すると、全角文字は2バイトで1文字ですから、11,030,551だと5,515,276文字となります。また半角文字は1バイト1文字ですから、1,225,617バイトだと1,225,617文字となります。

というわけで、全角の5,515,276文字と半角の1,225,617文字を足し算すると、「674万893文字」という数値が出てきました。なお、これを記事数の「4389」で割り算すると、1記事あたりに使われている平均字数を概算できます。結果「1536字」となりました。

文字も積もればブログとなる……。13年目もよろしくお願いします。

参考資料
COBOL2002使用の手引 手引編「基本機能」
http://itdoc.hitachi.co.jp/manuals/3000/30003D0800/GD080421.HTM
| - | 18:33 | comments(0) | trackbacks(0)
CALENDAR
S M T W T F S
 123456
78910111213
14151617181920
21222324252627
28293031   
<< January 2018 >>
SPONSORED LINKS
RECOMMEND
フェルマーの最終定理―ピュタゴラスに始まり、ワイルズが証明するまで
フェルマーの最終定理―ピュタゴラスに始まり、ワイルズが証明するまで (JUGEMレビュー »)
サイモン シン, Simon Singh, 青木 薫
数学の大難問「フェルマーの最終定理」が世に出されてから解決にいたるまでの350年。数々の数学者の激闘を追ったノンフィクション。
SELECTED ENTRIES
ARCHIVES
RECENT COMMENT
RECENT TRACKBACK
amazon.co.jp
Billboard by Google
モバイル
qrcode
PROFILE