comments trackbacks you may also like

『にほんブログ村』がん闘病ブログから個人情報が流出か?運営側の関与は?!

2019年09月17日
がんブログ
-
#無断盗用 #にほんブログ村無断盗用 #にほんブログ村 #無断転載 #無断転載とは #無断転載とは論文 #日本ブログ村 #にほんブログ村個人情報流出 #にほんブログ村がん闘病ブログ #がん闘病ブログ

胃癌ブログ『ゆうらり』の管理人Mです。胃がん闘病記の体調報告を書いていたのだけれど、ちょっと予定変更。なぜなら、たまたまネット検索していたところ、思わぬ記事を見つけてしまい唖然!となったものですから…。“注意喚起”の意味合いも兼ねて、この記事を書くことにしました。

その、ネット検索で見つけた記事というのは、ブログのコミュニティ・ランキングサイト『にほんブログ村』(株式会社ムラウチドットコム運営)に登録するおよそ350件分の「がん闘病ブログ」についてのもの。

自称“研究者”と名乗る一部の者らが、何ら許可を得ずに「フリーソフト」を使って勝手にデータ収集していることを指し示す記事が公開されているのです。今の時代に逆行するような、故意的な意思に基づいて行われている、いわば「データの盗み取り」というやつ。これって、個人情報流出の危険性さえうかがえるものです。まさか、運営側も関与する「漏洩」でなければ良いのですが…。

にほんブログ村に登録するがん闘病ブログから勝手にデータ収集・分析?「がん闘病ブログの計量テキスト分析」と題したWebページ

研究と題し無断でにほんブログ村に登録のがん闘病ブログからデータ収集する大学准教授

にほんブログ村に登録されている348件の「がん闘病ブログ」から、フリーソフトを用いて勝手にデータ収集。さらに、データクリーニングを行なったうえで分析結果と称した内容を、がん闘病ブログの計量テキスト分析というWebページで公開しているのです。

▼データクリーニング(別名:データクレンジング)とは?

データクレンジングとは、データベースに保存されているデータの中から、重複や誤記、表記の揺れなどを探し出し、削除や修正、正規化などを行い、データの品質を高めること。

引用:データクレンジングとは - IT用語辞典 e-Words

身勝手な主観に基づいて書かれた「がん闘病ブログの計量テキスト分析」の問題点

無断でがん闘病ブログの情報を盗用して非難を浴びる大学准教授

この、「研究」と称して書かれている内容。あまりにも身勝手な主観(偏見と言っても良いかも)に基づいてつづられており、問題点を抽出したらキリがないほどなのだけれど、ザッと簡単にピックアップすると以下の通りです。

【問題点①】

終末期のがん患者においては、そもそもインタヴュー調査に耐えられる人が少ないこと、また本当の臨死期の調査が不可能であるといった限界はある

がん闘病ブログの内容を無断で盗用している理由について、勝手な言いぐさを書いています。都合のいいところで「がん闘病ブログ ≒ 終末期のがん患者」のような書き方をして、適当な言い訳のタネに使っています。

単純に言うと、ブログの運営者1人1人から許可を得たりするのが面倒だからこんな適当な論法を用いて、データの無断盗用していることを正当化しようとしている訳です。

しかし、そもそも「がん闘病ブログ ≒ 終末期のがん患者」ではありませんし、このWebページだって、にほんブログ村に登録されている348件のがん闘病ブログからフリーソフトを用いて無作為にデータ収集している訳ですから、その辺のことは認識しているはず。

ちなみに、僕はやっぱり「がん闘病ブログ ≒ がんを克服した患者」をメインだと考えています。

【問題点②】

タレントの小林麻央さんは死の直前まで、闘病や日々の生活、自分自身のことをブログに書き続けた。彼女が有名人であったことも影響しているだろうが、 web 上にある闘病ブログを読んでみると、多くの人が同じように死の直前まで、たとえ短い文章であってもブログを書き続けていることがわかる。

一時期、がん闘病にまつわる話しをする時は、何かにつけて小林麻央さんのことを引き合いに出す週刊誌やバイラルメディアが相次いだのは皆さんの記憶にも残っているかと思います。

今回も、まるでどこかのネットニュースで書かれた小林麻央さんの記事をコピペしたような記載がされてます。このWebページの執筆者、がんのことなんてまったく知らんのやろ⁈ 最近なんて、がん闘病を公表しているタレントはわんさかいるというのに…。

こういう記述を見ると、さも“研究”などと題した執筆者のがんについての見識のみならず、人格さえも疑いたくなるのです。

【問題点③】

3-2 本研究で収集した闘病ブログデータweb 上のブログ全体を収集対象とするのが理想であるが、何をもって「闘病ブログ」とするか(たとえば 「がん」or「癌」という言葉が記事中に出てくるだけでは、それが本人の闘病経験をつづったものなのかは わからない)等さまざまな問題が生じる。そのため、本研究では、収集対象とするブログの範囲(母集団) を、個人ブログのアグリゲーションおよびコミュニティ・ランキングサイトである「にほんブログ村」 (https://www.blogmura.com/)において、メインカテゴリー「病気ブログ」に登録されているブログとした。「にほんブログ村」は、ブログの内容によって細分化されたカテゴリーに、著者自身が登録する(3 カテゴリーまで可能)ことが大きな特徴であり、ほかのブログポータルサイトなどでは系統だって探すことが難しいがん患者のブログを見つけることが可能である。

「にほんブログ村」だけだなんて書いているけど、そんな訳ないでしょ(爆笑)人気ブログランキングをはじめ、たくさん存在しています。

この記述だけを見ても、この執筆者がまったく「がん」について無知であることのみならず、病気やブログ、インターネットに至るまで知見の浅い未熟者であることが窺い知れます。

しかし、これだけ「にほんブログ村」を殊更に強調するのには何か理由があるのでしょうか?もしも、にほんブログ村がこのようなデータ収集に関与・協力しているのであれば、登録しているブログユーザーの個人情報が漏洩している可能性すら疑われる訳ですから、大問題ですよね。

【問題点④】

ブログの特定につながらないよう、著者やブログにかんする情報は分析に影響しない範囲で書き換えている。

こんなことは、問題点を論じるまでもありません。「情報の無断盗用→転載」を隠ぺいするための悪質な違法行為です。

今の時代。さすがに大学の准教授と名乗る研究者がこんなお粗末で無知なことはやらないだろう?と考えるかも知れません。しかし、畑違いのことをすれば人間なんてこんなものですよ。

▼関連記事

環境省、公式Twitterに「うな重の画像」を無断転用し謝罪について最低限知っておくべき1つのこと

日本の環境省が『土用の丑の日』にちなみ、公式Twitter上で「(ウナギを)大事にいただきましょう」とツイートしたことがさまざまな問題を招いたそうです。ニュースを知って急いでツイッターを開いたのですが、この投稿はすでに削除されていました。どうやら、環境省がツイートする際に用いた画像が他から無断転用したものだったらしいのです。...

そもそも、ねつ造がなされた内容のものに研究などと題する資格はありませんし、研究としての価値も存在しないのです。

【問題点⑤】

なお、すべての分析にフリー・ソフトウェアである KH Coder(樋口 2014)を用いた。

研究者などと名乗っておきながら、いかがわしいフリー・ソフトなんて使って違法なことやってんじゃないよ。まったく…。

▼KH Coderとは?

KH Coderとは、テキスト型データの計量的な内容分析もしくはテキストマイニングのためのフリーソフトウェアである。各種の検索を行えるほか、どんな言葉が多く出現していたのかを頻度表から見ることができる。

引用:ウィキペディア

だってさ、あんた。個人のブログには個人情報がワンサカ書かれているケースだってあるというのに、運営者の許可を得ずにフリーソフトを使ってデータを盗み取るなんて許される訳ないでしょ?おまけに「バレないように改ざんしました」なんて書いちゃってるし(汗)

ブログによっては、ブロガーさん自身が実名を公表して運営しているケースも多いですし、そうなると、色んな個人情報が連なって分かってしまうものです。

おわりに/にほんブログ村の責任は⁈

がん闘病ブログの個人情報が勝手に収集されて唖然とするブロガー

今回の、「研究」と称した問題だらけのWebページ。さも「研究発表」らしくPDF文書で公開しているのだけれど、これはそういった意味合いとは別の理由が存在するようにも思えます。

この単体のWebページだけでは、作成者にお伺いのたてようがないのです。どこにも問い合わせ先が表示されてないし…。こういうのは、自分のWebサイトで公開しろよ!って話しですよまったく。

大学や名前は記述がありますが、これを基に連絡先を調べて問い合わせをしたら「知らない」とか言われちゃったりするのでしょうか⁈

あと、問題なのは「にほんブログ村」の責任について。今後、これについてはどう対応するのか?そもそも知らなかったりして(汗)何よりも、執筆者とは何ら無関係であることを願いたいものです。とりあえず、データを収集されたのでは?とお心当たりがおありのブローガーさん。かかるWebページが削除される前にPDF文書を保存しておくことをおすすめします。

PDF文書をダウンロードする

追記:きっと、僕のブログもデータが盗用されたのでしょうね。でも良かった、がん以外のネタをたくさん書いておいて…。フリーソフトなんかでデータを抽出したら、僕のブログからは「モー娘。」や「AKB」、「ベビメタ」など様々な言葉が出てきます。これをどうやってデータクリーニングにかけるのですかね(^_^;)

\チェック/

【ランキングに挑戦中】

いつも応援クリック↓
ありがとうございます

にほんブログ村

関連記事
M
この記事を書いた人: M
ブロガー/FC2公式おすすめブログ認定/企業家/投資家/Fashion研究家/不動産コンサルタント/会社経営/将棋六段/おうちごはん男子部/料理を悪戦苦闘修行中/ヘッドスパとスイーツをこよなく愛する46歳/人生なんて気持ち次第‼︎きっと何くるないさ〜(´ー`)
FC2ブログオフィシャルおすすめブログ認定バナー日本ブログ村 プロフィール

この記事が気に入ったら
いいねとシェアしよう!

data-matched-content-ui-type="image_card_stacked" data-matched-content-rows-num="6,2" data-matched-content-columns-num="1,5"
現在の人気記事はコチラ!
未分類 (0)
シン・胃がん闘病記 (31)
┣  AVANT: 癌の余命宣告~共存 (20)
┗  セントラルドグマ: 父親の胃癌 (11)
胃がん(ブログ、闘病記録、胃癌ニュース、私の症状など胃ガン情報全般) (5948)
┣  胃がんブログ (285)
┣  よりぬき 胃がんブログ (16)
┣  胃がん闘病記・日記 (5586)
┣  酒場放浪記 (10)
┣  胃がん手術後の食事記録 (6)
┣  胃切除後の料理など (35)
┗  がん治療のクラウドファンディング (10)
胃がん History (85)
┣  ステージ3B 多発性高度リンパ節転移胃癌 (57)
┗  胃がん再発「転移性肝がん」で余命宣告 (27)
がん のこと(ガン情報全般) (512)
┣  がんブログ (290)
┗  がんニュース (222)
胃がん 障害年金ブログ (71)
┣  障害年金 - 準備編 (23)
┣  障害年金 - 審査から年金受給まで (12)
┣  障害年金 - 審査請求・不服申立 (26)
┗  障害年金 - 再審査請求 (10)
Amazon (ニュース、お得なセール情報など) (142)
┣  Amazonセール (2)
┗  📱kindleセール (139)
おもしろグッズ (11)
今日のエッセイ (114)
ニュース・芸能・話題 (777)
┗  転職・キャリアアップ (21)
占い・心理テスト (6)
恋愛・人間関係 (29)
終活ブログ (12)
グルメ (103)
┣  低糖質レシピ (25)
┗  お酒の飲み方 (2)
胃切除後の食事・レシピ (670)
┣  ご飯・おかゆ・和食 (174)
┣  おかず (139)
┣  味噌汁・スープ (74)
┣  カレー関係 (66)
┣  パン・洋食 (63)
┣  麺類 (112)
┗  その他、簡単レシピなど (39)
ブログ (243)
┣  FC2ブログ・便利ワザ・アイテム・HTML・SEO対策など (187)
┣  FC2ブログ日記(カスタマイズの所感など) (9)
┣  Google Adsense (アドセンス) (8)
┣  趣味や将棋のこと (31)
┗  ファッション (8)
iPhone の使い方・アプリなど (32)
司法書士 (26)
┣  仕事・実務や登記のこと (1)
┗  事件ファイル (25)
COLLECTION (27)
┣  家電 (11)
┣  ホーム&キッチン (4)
┣  ビューティー&ケア (5)
┣  QOLの改善&ヘルスケア (2)
┗  お酒 (5)