コンテンツの読み込みに時間がかかっています

機械翻訳はスパム行為なの? 適切なマークアップを調べてみた


弊社で開発を行っているCMS「a-blog cms」に 多言語コンテンツの管理機能 の拡張アプリのリリースを準備している。リリースは2019年4月以降で、動作可能なバージョンは Ver. 2.10.0 以降になる予定です。

a-blog cms の新しい機能として、日本語から他の言語の記事を作成する際に Google Cloud Translation API を利用し翻訳機能を用意し記事を作成すること ができるようになりました。しかし、機械翻訳はスパム行為にあたる可能性があるかもしれないという事を知り調べたことを書いてみます。


a-blog cms 多言語設定のキャプチャ画面


機械翻訳とスパム行為のワードで検索してみると

機械翻訳 スパム行為」で、Google 検索してみるとたくさんのページがヒットしますが、いくつかの記事をピックアップして紹介してみます。

やはり、情報のソースとしては、Google のガイドラインに書いてあるからって事でダメなんじゃないだろうかと書かれているものが多いことがわかります。

ウェブマスター向けガイドラインには

確かに、ウェブマスター向けガイドライン(品質に関するガイドライン) の具体的なガイドラインに コンテンツの自動生成 という項目があり

  • 自動化されたツールで翻訳されたテキストが人間によるチェックや編集を経ず公開されたもの

しかし、その前の文章には

Google では、検索ランキングを操作することを目的としている、ユーザーの役に立たないコンテンツに対し、措置を取ることがあります。たとえば、次のようなものがこれに該当します。

と、書かれています。

自社のサイトのコンテンツを翻訳する際には、検索ランキングを操作することを目的としているわけでもなく、ユーザーの役に立たないコンテンツでもないのではないかと思ったりしますが、どうなのでしょうか?

もちろん、機械翻訳しているので少し変な言葉になっている可能性もありますが...

Translation API 利用時のマークアップについて

では、この機械翻訳を提供している Google Cloud のドキュメントに Translation API マークアップ を調べてみることにします。

機械翻訳をして生成した ( Translation API 利用した ) ページは、このようにマークアップしなさい!という事が書かれています。

<DOCTYPE HTML>
  <html lang="en-x-mtfrom-ja">
    <head>
      <title>Example document</title>
      <link rel="alternate machine-translated-from"
        hreflang="ja"
        href="https://appleple.com/example.html">
    ...
    

例えば、日本語の記事 https://appleple.com/example.html をコピーして機械翻訳した際の英語ページ https://appleple.com/en/example.html の HTML には以下のような記述が求められることがわかります。

また、Translation API マークアップ 自身のソースコードをチェックすると、各言語が用意されていることも書いておいてもいい気がします。

<link rel="alternate" href="https://appleple.com/fr/example.html" 
reflang="fr">

さらに、Google Cloud のドキュメントに 帰属表示の要件 というものがあります。 Cloud Translation API を利用しているコンテンツは translated by Google の表示とリンクが必要とのことです。

このように Google 的には、上記のようにマークアップすれば機械翻訳のページを作ること自体は、スパム扱いされることにはならないのではないでしょうか。

もちろん、検索順位的には人力翻訳のページの方が上位表示されることになるかもしれませんが...

Translation API を利用した多言語機能の提供を考えていますので、よかったらご意見がある人はお知らせください。


関連記事

この記事のハッシュタグ から関連する記事を表示しています。

CPI ビジネスパートナー様向けの大阪セミナーに参加

Google Maps API が使えないサイトについて

Google Chart API で QRコードが出るようになったそうです

ユーノスロードスター

lightbox から prettyPhoto に変更しました

Local Search Control ( Google Maps API ) の利用

Google Static Maps API