ガイド
AI生成画像を見抜く7つのサイン
Maat Scan · 2026年4月
2025年に実施された研究では、世界12,500人以上の参加者から28万7,000件の評価を収集した結果、 人間がAI生成画像を正しく識別できた割合はわずか62%でした1。 コインを投げてランダムに答えるのと、ほとんど変わらない数字です。
しかもその調査が行われたのは、最新世代の画像生成モデルが登場する前のことでした。 「本物らしさ」と「本物」のギャップは、今もなお広がり続けています。 チェックリストを暗記するのではなく、AIが今でも苦手とする部分と、 もはや通用しなくなった見抜き方の両方を知ることで、そのギャップを縮めることができます。
かつて有効だった見分け方が通じなくなっています
指が6本ある手。かつてAI画像の代名詞だったこの特徴は、もはや信頼できるサインではありません。 2025年までに、MidjourneyやDALL-Eといった主要モデルは手の描写を大幅に改善しました。 看板や服に書かれた文字の崩れも、上位モデルでは修正されています2。 「指の数を数える」という見分け方は、すでに古くなっています。
サイン1:プラスチックのような肌
2026年時点でも、主要な生成モデル全般に共通する最も根強いアーティファクトがこれです。 AI生成の肌は毛穴がなく、産毛もなく、小さな傷跡もありません。 光を均一に反射する、異様に滑らかな表面として描かれます3。
本物の肌は不均一です。フラッシュや強い光の下では、テクスチャ、赤み、色むらが見えます。 AI生成の40代の肖像が実際の25歳の写真より若く見えることが多いのは、 モデルの学習データが理想化された写真に偏っているためです。 額、鼻の脇、あご先を拡大してみてください。 磨いた大理石のようなテクスチャがあれば、それはサインです。
サイン2:ズレた反射
鏡面は、AIが環境を「理解」していないことを暴きます。モデルは統計的なパターンに基づいて 画像の各部分を生成するため、鏡がカメラの後ろを映すべきだとか、 サングラスのレンズが被写体の背後の景色を反射すべきだとか、 そういった論理的な制約を持っていません。
サングラス、目、金属製のもの、光沢のある面を確認してみてください。 屋外で撮影された人物のサングラスに屋内の景色が映っていたり、 何も映っていなかったりすれば、AI生成の可能性は高いです。 目そのものも同様です。瞳に映るキャッチライト(光の反射)は、 両目で形も位置も一致しているはずです。 左右で異なっていたり、奇妙な幾何学的形状をしていたりすれば、それはサインになります。
サイン3:輪郭のハロー
被写体と背景の境界部分に、AI画像はしばしば微妙なフリンジ(わずかなぼかしや色の滲み)を 生じさせます。生成モデルは実際の光の反射をシミュレートするのではなく、 統計的に画像を構築するため、こうした痕跡が残ります。
髪の毛の端、肩、耳が背景と接する部分を見てみてください。 実際の写真では、強い光はシャープなエッジを作り、柔らかい光は自然な滲みを作ります。 AI画像では、その中間のような——少し滑らかすぎて、少し均一すぎる——移行が生じることが多く、 写真というよりも合成画像の継ぎ目のように見えます。
サイン4:「機能しないもの」に注目する
2025年の研究によると、拡散モデル生成画像において、 人々が真贋判断に苦労した画像の58.7%に「機能的不整合」が含まれていました3。 これは解剖学的な異常(51.4%)よりも頻度が高かったにもかかわらず、 人々が疑念を説明する際にこの点を指摘した割合はわずか21%でした。
機能的不整合とは何でしょうか。チューニングペグにつながっていないギターの弦、 針のない時計の文字盤、ジャケットの途中で消えるジッパー、 傾けると中身がこぼれるはずの角度で持たれたコーヒーカップ。 人間なら無意識に気づくような部分を、AIは学習データ上の露出が少ないために 正確に学習できていません。「これは実際には機能しないのでは」と感じたら、 その直感を信じてください。
サイン5:境界部分の髪
AI画像にとって髪の毛は難しい対象です。個々の毛の描写が間違っているというより、 髪が他の面と接する部分の処理に問題が出やすいのです。 生え際では、髪と肌の境界が不自然にぼけることが多く、 毛先が頭皮からわずかに浮いて見えたり、背景に溶け込むような表現になったりします。
明るい背景に対するふわふわした髪はよく見られる手がかりです。 中心部の毛は正確に見えますが、毛先が背景に向かって溶けていく様子は、 写真というより粗いトリミングのように見えます。
サイン6:矛盾する光
実際の写真には、一つの光源(またはまとまりのある複数の光源)があります。 画像内のすべての影、すべてのハイライト、すべての反射は、 同じ照明条件で説明できるはずです。AIモデルは特徴ごとに光を生成するため、 不整合が生まれやすい傾向があります。顔は左から照らされているのに首の影の方向が逆、 屋内にいる人物が屋外の直射日光のような強いハイライトを持つ、 被写体の額のハイライトとは別方向に落ちる影——こうした矛盾が一枚の写真の中に 混在することがあります。
「光源はどこにあるのか?」と問いかけて一貫した答えが出てこなければ、 それは意味のある手がかりです。
サイン7:「それらしい」だけの背景
AI画像の背景は、実在する場所を描いたものではなく、 「そこにあるべきもの」をモデルが予測して生成したものです。 そのため、ざっと見ると自然に見えながら、よく観察すると破綻している、 という独特の質感が生まれます。タイトルの読めない本が並ぶ本棚、 背景の群衆で顔がぼやけて似通っている人たち、 パースや間隔が不自然な建築の細部(手すり、窓、タイル)、 石壁や芝生のような自然のテクスチャが実際の表面にはないような 繰り返しパターンを持っている——こうした特徴が見られることがあります。
背景はAIが統計的に省力化しやすい部分です。 画像に疑念を持ったとき、まず背景を確認するのは有効な方法です。
見分け方の限界について
どれか一つのサインが決定的な証拠になるわけではありません。 すりガラス越しに撮った本物の写真は輪郭がぼけますし、 スタジオ照明で撮った肖像は肌が完璧に見えます。 2026年の独立したベンチマークでは、複数の検出ツールと目視を組み合わせた手法でも、 生成モデルと後処理の方法によって精度は62〜94%にとどまっています2。
重要なのは、サインの重なりです。同じ画像に上記の特徴が2〜3個見られれば、 AI生成の可能性は大きく上がります。より確実な判断が必要なときは、 肉眼では見えない技術的なシグナルを複数の角度から分析する Maat Scanのようなツールが役に立ちます。
出典
- Köbis et al., "How good are humans at detecting AI-generated images? Learnings from an experiment," arXiv / Microsoft Research, 2025. arxiv.org/abs/2507.18640
- "AI Image Detector Accuracy Test: We Tested 5 Tools Against Every Generator (2026)," Imagera AI, 2026. imagera.ai/blog/ai-image-detector-comparison-2026
- Guillaro et al., "Characterizing Photorealism and Artifacts in Diffusion Model-Generated Images," CHI 2025. arxiv.org/html/2502.11989v1
