光子とは何か?
写真術全般の量子論的基盤
フィルム上であれ、センサー上であれ、スマートフォン上であれ、これまで撮影されたすべての写真は、一つの還元不可能な出来事——光子の到達——から始まる。
絞り、メガピクセル、フィルム粒子について論じる前に、最も根本的な次元——光そのものの本質——から出発しなければならない。これは抽象的な議論ではない。光が物理的・数学的に実際に何であるかを理解することは、今後あなたが撮影し、あるいは鑑賞するすべての写真に対する思考様式を根本から変えるであろう。
光は電磁放射である。電場と磁場を同時に振動させながら波として伝播し、宇宙の速度上限——真空中において毎秒約299,792キロメートル——で進む。しかし、ここで事態は奇妙な様相を呈し、写真術の科学的基盤全体が成立する:光は粒子としても振る舞う。これらの粒子は光子と呼ばれ、質量ゼロの離散的かつ不可分なエネルギーの束である。
光のこの波動・粒子二重性は、科学史上最も実験的に検証され、かつ哲学的に不穏な事実の一つである。写真術においては、粒子としての性質こそが最も重要である。光がセンサーやフィルム乳剤に当たるとき、それは滑らかで連続的な流れとして到達するのではなく——個々の光子の雨として到達し、それぞれが波長によって決定される固有のエネルギー量を担っている。
一個の光子のエネルギーは方程式E = hfによって与えられる。ここでhはプランク定数(6.626 × 10⁻³⁴ジュール秒)、fは光の振動数である。振動数と波長は反比例の関係にある(振動数が高いほど波長は短い)ため、青色の光子一個(〜450nm)は赤色の光子一個(〜700nm)よりも多くのエネルギーを有する。明るさ——私たちが強度として知覚するもの——は、個々の光子のエネルギーではなく、単位面積・単位時間あたりに到達する光子の数に過ぎない。[1]この区別——一光子あたりのエネルギーと光子数——こそが、カメラが低照度条件下で苦闘する理由、および単一光子検出という量子フロンティアが革命的である理由を理解する鍵である。
ここで、科学史上最も重要な発見の一つ——すべてのデジタル写真を可能にした発見——に言及しなければならない。1905年、26歳の特許局職員アルバート・アインシュタインは、光電効果と呼ばれる当惑させる実験結果を説明する論文を発表した:光が特定の金属に当たると、電子が放出される。古典的波動理論は、十分な時間があれば、いかなる光も電子を弾き出せると予測していた。しかし実験が示したのは、特定の振動数を超えた光のみが——その輝度に関わらず——電子を放出できるということだった。弱い青色光は電子を解放できたが、まばゆいほど明るい赤色の投光照明はできなかった。
アインシュタインの説明は急進的であった:光は離散的な束(光子)として到達しなければならず、各光子が電子を解放するのに十分なエネルギーを持つか否かのいずれかである。時間をかけて蓄積されることはない。この論文——相対性理論に関する業績ではなく——こそが、アインシュタインに1921年のノーベル物理学賞をもたらしたものである。そして、世界中のすべてのCCDおよびCMOSカメラセンサーが、シャッターボタンを押すたびに、毎秒数十億回利用している正確な物理メカニズムがこれである。
電磁スペクトル
電波からガンマ線まで——そして私たちが見ることのできる僅かな帯域
可視光は広大なスペクトルの中の極めて狭い帯域であり——カメラは眼と同様、その特定の窓に同調している。
電磁放射は波長と振動数の膨大な範囲にわたって広がっている:数百メートルの長さを持つ電波から、マイクロ波、赤外線、可視光、紫外線、X線、そして原子核よりも短いガンマ線まで。この全範囲が電磁スペクトルであり、そのすべてが同一の速度——光速——で伝播するが、各帯域は物質と著しく異なる形で相互作用する。
カメラと人間の眼はともに、このスペクトルの特定の狭い部分に同調した機器である。✓ Established人間の眼は約380ナノメートルから700ナノメートルの波長を検出する——私たちが可視光と呼ぶ範囲であり、短波長端に紫が、長波長端に深紅が位置する。[2]1ナノメートルは1メートルの10億分の1である。それを具体的に示すならば、私たちが知覚できる色の全範囲は約320億分の3.2メートル——電磁スペクトル全体のほんの僅かな断片に過ぎない。
この可視帯域の中で、異なる波長は異なる色の知覚を生み出す:紫(〜380〜450nm)、青(〜450〜495nm)、緑(〜495〜570nm)、黄(〜570〜590nm)、橙(〜590〜620nm)、赤(〜620〜700nm)。これらは恣意的な人間的カテゴリーではなく——色素、材料、および光受容体とそれぞれ異なる形で相互作用する、明確な物理的波長に対応している。
写真家にとって決定的に重要な点がある:シリコン——実質的にすべてのデジタルカメラセンサーに使用される材料——は人間の眼よりも広い波長範囲に感応する。シリコンは約200nm(深紫外線)から1100nm(近赤外線)にわたって応答する。フィルターなしに放置すれば、デジタルセンサーは私たちが見るものと劇的に異なる映像を生成するであろう——植物は淡く見え、空は奇妙な色調になり、肌の色調は歪む。これがすべてのデジタルカメラに赤外線カットフィルター(ホットミラーとも呼ばれる)がセンサーの前に配置されている理由であり——センサーの応答を人間の視覚知覚に概ね合致させるためである。
これは興味深い含意を持つ。赤外線カットフィルターを取り外した改造カメラを使用する写真家は、近赤外線での撮影が可能となり、緑の植物が白く輝き、青空がほぼ黒になる幻想的な映像を生み出す。センサーの本来の能力はそこに常に存在していた——ただフィルターによって遮断されていたに過ぎない。

可視スペクトルを超えて、カメラは特殊な用途のために他の帯域で機能するよう工学的に設計されてきた。医療用X線検出器は、X線光子を可視光に変換する蛍光体スクリーンを使用する。電波望遠鏡はセンチメートルスケールの波長に同調したアンテナアレイを使用する。サーマルカメラは温かい物体から放出される中間赤外線を検出する。これらはすべて、根本的に同一の営みである:検出器を電磁スペクトルの特定の帯域に同調させ、入射光子を記録可能な信号に変換する。物理的原理は普遍的であり——波長の窓のみが変わる。
デジタルセンサーはいかにして光を捉えるか
すべてのフレームにおける光電効果
デジタルセンサーとは微細な光電変換素子の格子であり、その各々がアインシュタインのノーベル賞受賞の発見を毎秒数百万回実行している。
現代のカメラセンサーは、巨視的スケールでは小さな灰色のシリコンの矩形に見える。しかし拡大すると、フォトサイト(またはフォトダイオード)と呼ばれる数百万個の個別光検出器が極めて精密な格子を形成しているのがわかる。各フォトサイトはシリコンの小さな井戸であり、その役割はエレガントなほどシンプルである:露光中に何個の光子が当たったかを数え、その数を電気電荷として報告する。
メカニズムは光電効果であり、微細なスケールで作動する。✓ Established光子がフォトサイトのシリコンに当たると、そのエネルギーをシリコンの結晶格子内の電子に移転する。光子が十分なエネルギーを持つ場合(すなわち波長が十分に短い場合)、その電子を束縛状態から解放し、電子正孔対と呼ばれるものを生成する。解放された電子は次いで収集され、フォトサイトのポテンシャル井戸に保持される。露光終了時、各フォトサイトに蓄積された電荷が読み出され、アナログ・デジタル変換器(ADC)によってデジタル数値に変換され、その位置のピクセル値として保存される。[1]
その数値——RAWファイルでは通常12ビットまたは14ビットで表現される——は、シーンのその地点における光の強度を表す。現代のデジタル交換レンズカメラは14ビットRAWデータを記録し、理論上はチャンネルあたり16,384段階の異なる階調表現を可能にする。[3]
センサーが入射光子を測定可能な電子に変換する効率は量子効率(QE)と呼ばれる。現実世界のセンサーで100%の量子効率を達成するものは存在しない。◈ Strong Evidence現代のコンシューマー向けDSLRおよびミラーレスセンサーは通常20〜50%の量子効率を達成しており、センサー表面に到達する光子の約半数から五分の四が無駄になっている——電子を解放することなく吸収されるか、反射されるかのいずれかである。天体観測用に最大限の光子捕捉のために最適化された天文学用CCDカメラは80%を超える量子効率を達成できる。これは主に、モノクロ(カラーフィルターアレイなし)で動作し、熱雑音を最小化するために冷却されているためである。[4]コンシューマーセンサーと科学用センサーの間のこの差は、カメラ工学における最も重要な未開拓の機会の一つである。
現在使用されている主要なセンサーアーキテクチャは二つある:CCD(電荷結合素子)とCMOS(相補型金属酸化膜半導体)である。両者ともに金属酸化膜半導体(MOS)技術に基づいて構築されており、個々のフォトサイトレベルでは同一の光電効果を利用している。[5]両者が異なるのは、蓄積された電荷をどのように読み出すかという点である。
CCDでは、各フォトサイト列からの電荷が——バケツリレーのように——センサーの端にある単一の出力アンプへと転送され、順次読み出される。これは非常に均一で低ノイズの出力を生むが、低速で消費電力が大きく、製造が複雑である。CCDは1970年代から2000年代初頭にかけて、プロおよび科学的撮像の分野を支配した。
CMOSセンサーは対照的に、各フォトサイトに直接アンプを持ち、任意のピクセルを独立して並列に読み出すことができる。これによりCMOSセンサーは劇的に高速で低消費電力となり、製造コストも低くなる。長年にわたり、CMOSセンサーはCCDよりもノイズ性能が劣っていたが——裏面照射(BSI)や積層センサー設計を含む継続的な工学的改善によって、その差はおおむね解消されている。
重要な——そしてしばしば誤解される——点が一つある:センサーのピクセルは光の強度を検出するのであって、色を検出するのではない。シリコンのフォトサイトは根本的に色盲である。波長を区別する本来の能力を持たず、光子を数えるだけである。色情報はフォトサイト上に色フィルターを配置することで付加されなければならない——これがデジタル写真史上最も重大な工学的妥協の一つへと私たちを導く。
ベイヤーフィルターの問題
なぜすべてのカメラはその光の三分の二を捨てるのか
デジタルカラー写真を可能にするカラーフィルターアレイは、同時に入射光子の大部分を破棄している——ほぼすべてのカメラに組み込まれた妥協である。
1976年、Kodakのエンジニアであるブライス・ベイヤーは、色盲センサーの問題に対する解決策を発明した。それはデジタル撮像とほぼ同義になるほど支配的となった:ベイヤー・カラーフィルターアレイ(CFA)である。アイデアは単純明快だ:赤・緑・青の小さな色フィルターのモザイクをフォトサイトアレイ上に配置し、各フォトサイトが一色の光のみを記録するようにする。そしてソフトウェアアルゴリズムを用いて、不完全なデータから完全なカラー画像を再構成する。
ベイヤーが選択した——そして実質的にすべてのデジタルカメラが今日でも使用している——特定のパターンは、緑フィルター2個、赤1個、青1個の2×2繰り返しグリッドである。✓ Establishedベイヤーアレイが赤や青の2倍の数の緑センサーを使用するのは、人間の眼が緑の波長に対してはるかに高い感度を持ち、緑の解像度を最大化することで最も知覚的に正確な輝度(明るさ)の詳細が得られるためである。[7]
各ピクセル位置で欠落している2色の値を、周囲のフィルター処理されたフォトサイトから推定する再構成プロセスはデモザイキング(demosaickingとも綴られる)と呼ばれる。これは根本的に補間的なプロセスである:カメラはピクセルの三分の二が実際に何色を見たかについて、隣接するピクセルに基づいて推測しているのである。高度なデモザイキングアルゴリズムはほとんどの状況でこれを驚くほど巧みに行うが、デジタル画像が細かい布地パターンにカラーモアレを示したり、高コントラストの境界に偽色フリンジを生じたりする原因はここにある。
✓ Established実質的にすべてのデジタルカメラは各ピクセルキャビティで三原色のうちの一色のみを捉え、その過程で入射光の約三分の二を破棄している。[7]これは特定のカメラの欠陥ではなく——ベイヤーフィルタリングセンサーの構造的な特性である。
代替案は存在する。シグマのFoveonセンサーは異なる深さに3層のシリコンを積層し、異なる波長の光がシリコンに異なる深さまで浸透するという事実を利用している——赤が最も深く、青が最も浅い。これにより、補間を必要とせずすべてのピクセル位置で3色すべてを捉え、理論上はより優れた色精度を提供する。実際には、Foveonセンサーはノイズ性能、低照度能力、および処理の複雑さに苦慮しており、商業的採用は限られている。
ハイエンドでは、中判カメラやスタジオシステムがマルチショットキャプチャーを使用することがある——センサーを物理的にシフトさせるか、回転フィルターホイールを使用して、三回の別々の露光で各フォトサイト位置で赤・緑・青のデータを捉える。これは完全な補間なしのカラーデータを提供するが、完全に静止した被写体と制御された照明が必要であり——スタジオの静物写真においてのみ実用的である。
フィルムはいかにして光を捉えたか
ハロゲン化銀、光化学、そして一世紀にわたるアナログ撮像
シリコン以前、光はまったく異なる物理プロセスを通じて捉えられていた——そのプロセスは、特定の点において今なお他に比類ない独自の階調的・スペクトル的・美学的特性を生み出す。
写真フィルムとは、その本質において、光化学系である。フィルム乳剤は——透明な基材(当初はガラス、後に硝化セルロース、次いでポリエステル)上にコーティングされたゼラチン層に懸濁した——ハロゲン化銀塩の微細な結晶、通常は臭化銀、塩化銀、またはヨウ化銀から成る。これらの結晶がフィルムの感光素子であり、デジタルセンサーのフォトサイトに類似している。
光子がハロゲン化銀結晶に当たると、光化学的連鎖反応が開始される。光子のエネルギーがハロゲンイオンから電子を解放し、その電子は結晶格子を通じて感度中心——結晶に意図的に工学的に導入された微細な不純物または構造的欠陥——へと移動する。感度中心において、自由電子が銀イオンを中性の銀原子に還元する。この過程を同一の結晶上で数回繰り返すと、銀原子の安定したクラスターが形成される:潜像である。これは肉眼では見えない——それは化学的ポテンシャルであり、可視的なマークではない。
✓ Establishedフィルムはハロゲン化銀結晶との光化学反応を通じて光を記録するのに対し、デジタルセンサーは光子を直接電気信号に変換する——根本的に異なる物理プロセスである。[8]潜像は化学的現像によって可視化される。現像剤(還元剤)が露光された結晶内のすべての銀イオンを金属銀に変換することで銀クラスターを増幅する——これは極めて大きな増幅プロセスである。未露光の結晶はその後、定着剤(チオ硫酸ナトリウム)によって溶解され、永続的な画像が残る。
デジタル撮像との重要な構造的差異は、フィルムの階調応答がアナログかつ連続的であることだ。14ビットファイルにおける0から16,383の離散的な整数値ではなく、フィルムの濃度はシーン全体を通じて滑らかに変化する。決定的なのは、フィルムの特性曲線——露光と結果として生じる濃度の関係——がハイライト端でなだらかなS字型のロールオフを示すことである。露光過多に向かうにつれ、フィルムの応答は突然クリップするのではなく、徐々にかつ優雅に圧縮される。多くの写真家やシネマトグラファーが、これによってフィルムのハイライト処理がより美学的に寛容で視覚的に好ましいと主張している。
フィルム粒子は露光時間の影響を受けないが、デジタルノイズはそうではない——そして粒子の有機的なランダム性は、高ISOにおけるデジタルノイズの構造的パターンとは異なる知覚的性質を持つ。
— Wikipedia, Comparison of Digital and Film Photographyフィルム感度——ISO評価——は、ハロゲン化銀結晶がどれほど容易に光に反応するかを反映する。高感度フィルムはより大きな結晶を使用し、光子捕捉のための断面積は大きいがより粗く目立った粒子を生む。低感度フィルムはより小さく密に詰まった結晶を使用し、より細かな粒子と優れた解像力を提供するが、より多くの光を必要とする。2022年時点で市販された最も感度の低い写真フィルムはISO 0.8(FPP Super Positive)であった[8]——非常に明るい条件か極めて長い露光を要するフィルムである。
カラーフィルムはさらなる複雑さを加える。カラーネガフィルムはスペクトルの異なる部分に感応する3つの乳剤層を使用し、現像中に補色のカラーカプラー化学物質が色雲を生成する。各層のスペクトル応答は、ハロゲン化銀結晶に添加された増感色素によって決定される——そしてこれらの応答曲線は広く、重複し、色精度と感度のバランスを取るよう慎重に調整されている。
フィルム対デジタル
スペクトル応答、ダイナミックレンジ、そして粒子対ノイズ論争
両技術は媒体においてのみならず根本的な物理において異なり——その優劣は専門家の間で真剣に議論され続けている。
フィルムとデジタル写真の比較は、視覚メディアにおいて最も信頼性をもって論争的なトピックの一つである。この議論が持続する理由の一つは——商業的にデジタルが明確に覇権を握った後でさえ——両技術が単に優劣の問題ではなく、種類において異なる形で差異をもたらしているからである。物理を理解することで、どの主張が客観的でどの主張が美学の問題であるかが明確になる。
デジタルの優位性
フィルム固有の特性
ISO比較は特に強調に値する。✓ EstablishedデジタルカメラはISO相当感度4,560,000を達成している——従来のハロゲン化銀フィルム化学では物理的に不可能な感度レベルである。[9]かつて広く入手可能だった最速のプロフェッショナルフィルム、Kodak P3200またはIlford Delta 3200は、現像での増感を施してもISO 3200程度が上限であった。その差は漸進的なものではなく——極端な低照度条件において、デジタルが約3桁の感度的優位を持つことを意味する。
しかし、ハイライト処理と階調ロールオフに関する議論は純粋に美学的なものではない。それは両システムの応答曲線における実際の物理的差異を反映している。デジタルセンサーには硬い飽和点がある——フォトサイトが最大数の電子を収集すると、それ以上光子が加わっても信号が増加せず、ハイライトは純白にクリップされる。フィルムの光化学的応答は段階的に圧縮され、より広い露光過多の範囲にわたってハイライト詳細を保存する。現代のデジタル後処理技術とHDR技術はこのロールオフを部分的に模倣できるが、飽和時の基礎となるセンサー物理は二値的なままである。
ほとんどの実用的な目的において——特にISO範囲、一貫性、利便性、低照度性能において——デジタルがフィルムを明確に凌駕していることは疑いない。[8]しかしながら、フィルムのアナログ階調応答曲線は多くの専門家によってより寛容で美学的に好ましいとみなされており、フィルムのカラー乳剤は離散的な整数色階調に制約されない。また大判フィルムシステムは同等コストにおいて現行のデジタルセンサーの解像力を超えることもある。デジタルがすべての指標で勝利したという主張は——特定のフィルムストックの階調的・色彩的特性が積極的に求められているプロのシネマトグラフィー、ポートレート、ファインアート写真のコミュニティにおいては——特に異議が唱えられている。
露出のトライアングル
絞り、シャッタースピード、ISO ― 物理的特性とトレードオフ
センサーに到達する光量を決定する三つの変数は、単純な明るさをはるかに超えた次元で画像を変容させる。
露出とは、一枚の写真においてフィルムまたはセンサーに到達する光の総量を指す。これを制御するのが、写真家が露出のトライアングルと呼ぶ三つの変数 ― 絞り、シャッタースピード、ISO ― である。これらのコントロールを単なる操作上の調整として捉えるのではなく、物理的な次元において理解することで、創造的な判断の質は根本的に変化する。
絞り:光の漏斗
絞りとは、レンズ内部に設けられた可変開口部であり、重なり合う金属製の羽根(絞り羽根)によって形成される。その直径は、レンズを通過する光錐のうち実際にカメラ内部へ入射する光量を制御する。開口が大きいほど多くの光が入射し、小さいほど少なくなる。
絞りはF値(またはF段)によって表される:f/1.4、f/2、f/2.8、f/4、f/5.6、f/8 等がその例である。F値はレンズの焦点距離と開口径の比率である。重要な点として、F値と光量の関係は反比例であり、かつ二乗の関係にある。絞り面積は直径の二乗に比例して変化するため、F値の系列における一段の変化(例:f/2.8からf/4へ)はセンサーに到達する光量を半減させる。f/1.4からf/8への変化 ― 五段の差 ― は入射光量を32分の1に減少させる。
絞りはまた被写界深度 ― 被写体の距離のうち許容できる鮮明さで写る範囲 ― をも制御する。大きな絞り(小さなF値)は浅い被写界深度をもたらし、背景は滑らかなボケとして描写される。小さな絞り(大きなF値)は深い被写界深度をもたらし、近景と遠景を同時に鮮明に描写する。これは副次的な効果ではなく、レンズ合焦の光学的帰結であり、写真における最も強力な構図上の手段の一つである。
シャッタースピード:次元としての時間
シャッタースピードは、センサーが光に露光される時間を制御する ― 夜間撮影における数秒の長時間露光から、スポーツカメラの1/8000秒以下に至るまで多岐にわたる。シャッタースピードと絞りは完全な相反関係にある。シャッタースピードを倍にする(例:1/125秒から1/250秒へ)と、絞りを一段絞るのとまったく同じく、露出は半減する。
しかしシャッタースピードは、動体の記録様式をも決定する。高速シャッターは動体 ― 水滴、アスリート、飛翔する鳥 ― を凍結し、瞬間を鮮明に捉える。低速シャッターは、露光中に移動する被写体がフレーム上でブレを生じさせ、滝の流線や市街地の光跡を描出する。これは処理によるものではなく、物理的な現象である。センサーは露光の全期間にわたって光子を記録しており、移動する被写体はその光子を単一の鮮明な点ではなく、軌跡を描く複数の画素位置に分散して記録する。
ISO:増幅とその代償
ISOは三つのコントロールの中で最も誤解されている概念である。✓ Established デジタルカメラにおいてISOを上げることは、センサーが光子に対して物理的により高い感度を持つことを意味しない。光子が計数された後にセンサーから出力される電気信号を増幅するのである ― かすかな録音の音量を上げることに類似した操作である。[10] ISO 100とISO 6400では、同一の露出条件において同数の光子がセンサーに到達する ― ただしISO 6400では、得られた信号がさらに64倍増幅される。
この増幅の代償はノイズである。すべてのセンサーは、熱ノイズ、読み出しノイズ、ショットノイズといったランダムな電気的変動を一定量持つ。低ISOではこのノイズは光子からの信号によって圧倒される。高ISOでは増幅によって信号とノイズが等しく引き上げられるが、決定的な点として、光子信号はそもそも小さかった(光量が不足していたため)ため、ノイズが全体に占める割合が増大する。これが高ISO画像の粒状感の物理的な原因である。
| 変数 | 露出への影響 | 創造的・物理的副効果 |
|---|---|---|
| 絞り(開放側) | 被写界深度の浅化;背景のぼけ(ボケ) | |
| シャッタースピード(低速側) | 移動被写体のモーションブラー;手ブレのリスク | |
| ISO(高設定) | ノイズの増大;信号とノイズを等しく増幅 |
カメラとしての人間の眼
瞳孔、網膜、神経処理 ― この類比が成立する点と破綻する点
眼とカメラは驚くほど多くの構造的な類似性を共有するが、眼はカメラというよりも、深遠な神経的後処理を伴う生物学的映像システムである。
人間の眼とカメラの比較は光学における最古の類比の一つであり、真に示唆に富む観点を提供するが、両者が共通点と同様に重要な相違点を持つことから、慎重な取り扱いが求められる。
構造的な類似は実在する。眼は入射光を後部の光感受性表面に結像させるレンズを持つ。そして調節可能な絞り ― 虹彩 ― を持ち、これが明るい日光下での約2mmから暗闇での約8mmまで瞳孔の直径を制御する。[11] 人間の眼の有効焦点距離は35mm換算で約22mmである(物理的な焦点距離は約17mm)。[11]
光感受性表面 ― 網膜 ― には二種類の光受容細胞が含まれる:桿体と錐体である。中央の中心窩に集中する錐体は、日光条件下での色覚を担う。約600万個の錐体は、赤・緑・青におおよそ対応する異なる波長域に感受性を持つ三つのサブタイプに分類され、これはBayerフィルターアレイが模倣する三チャンネルの色彩構造と同一の原理である。約1億2000万個の桿体は周辺網膜全域に分布し、光に対して極めて高い感度を示すが、色彩情報は提供しない ― これが非常に薄暗い条件下で色が脱彩色して知覚される理由である。[11]
ここでカメラとの類比は崩れ始める。人間の眼はカメラセンサーのように単一の均一な画像を捉えるのではない。高解像度で色覚に優れた中心部である中心窩は、視角にしてわずか約2度 ― 腕を伸ばした際の親指の爪程度の大きさ ― しかカバーしない。網膜の残りの部分は、低解像度かつ動体感知に優れた周辺視覚情報を提供する。脳はこの解像度の極端な不均一性を補償するため、サッカードと呼ばれる急速な不随意運動によって眼を絶えず動かし ― 毎秒数回 ― 多数の高解像度中心窩サンプルから合成的な場面像を構築する。
これが意味するのは、眼が本質的に走査システムであり、単一ショットの撮像装置ではないということである。この眼のサッカード走査を考慮した有効解像度の推定値として576メガピクセルという数値が示されることがある。⚖ Contested この数値は激しく論争されている ― それはカメラの作動原理とは相容れない形で走査過程と静止画キャプチャを混同するものであり、眼とカメラのメガピクセル直接比較は特段の意義を持たない。[11]
網膜の光受容体の特性として最も注目に値し ― かつ十分に認識されていない ― のは、絶対的な限界における感度である。◈ Strong Evidence 人間の眼は単一光子を検出できる。しかし重要な留保がある:眼は、網膜神経回路における信号対雑音の閾値処理により、短時間内に複数の光子が検出されない限り、この単光子事象を脳へ伝達しない。[4] この神経的ゲーティングは、ランダムな熱ノイズが偽の視覚知覚を引き起こすことを抑制する ― ポスト処理においてではなく、視覚ハードウェアのレベルにおいてハードウェアとして実装されたノイズ低減システムである。
ダイナミックレンジの対決
眼対センサー ― この比較が思うよりはるかに複雑な理由
眼の卓越したダイナミックレンジは実在するが、それは瞬間的にではなく時間をかけて機能するものであり、カメラセンサーとの比較には慎重な留保が必要である。
人間の眼がダイナミックレンジにおいてカメラセンサーとどう比較されるかを多くの写真家に問えば、「眼の方がはるかに優れている ― 20段、30段、あるいはそれ以上」という答えが返ってくるであろう。これはある意味において正しく、別の意味において誤解を招く。この区別を理解することは、高コントラストの場面で撮影する写真家にとって実践的な意義を持つ。
ダイナミックレンジとは、有用な細部を同時に捉え得る場面の最明部と最暗部の輝度比を指す。これはF段(あるいは等価的に露出値段またはEV)で測定され、各段は輝度の2倍の係数を表す。
◈ Strong Evidence 人間の眼の瞬間的なダイナミックレンジ ― 適応なしの単一の注視において知覚できる範囲 ― は約10〜14段である。[11] これは8〜14段のダイナミックレンジを達成する現代の高性能DSLRおよびミラーレスカメラセンサーに近い値である。[11] 瞬間的な直接比較において、現代のフルフレームセンサーと人間の眼は真に競合的な水準にある。
20段以上 ― 時に24段とも引用される ― というより大きな数値は、眼の総適応範囲を指す:星明かりから明るい日光に至るまで、瞳孔の収縮・散大と光化学的適応(桿体および錐体の時間をかけた感度調整)の双方を用いた、眼が機能できる光のレベルの全範囲を意味する。この適応は瞬間的ではなく、照明の劇的な変化に眼が完全に適応するには数秒から数分を要する。[11]
この区別は実践的な写真において甚大な意味を持つ。扉口に立ち、暗い室内から明るい屋外の情景を眺める際、人は両方に細部を知覚するが ― これは眼が場面全体にわたって継続的に適応している結果であり、すべてを同時に捉えているわけではない。同一の場面を単一の露出でカメラに収めようとすれば、選択を迫られる:室内に露出を合わせて屋外を白飛びさせるか、屋外に露出を合わせて室内を暗部につぶすか。これが高コントラスト写真の根本的な課題である。
現代のカメラはいくつかの部分的な解決策を発展させてきた。HDR(ハイダイナミックレンジ)撮影は、異なる設定で撮影された複数の露出を合成して実効的なレンジを拡張する。スマートフォンにおけるコンピュテーショナルHDRは、急速に連続して複数の露出を撮影し、アルゴリズム的に合成した上で単一の画像として表示する ― 眼の適応能力を一瞬において模倣しようとする技術的な試みである。ビデオカメラにおけるログプロファイルは、後の製作段階での展開に備えてハイライトとシャドウの情報を保持するため、階調範囲を圧縮する。
これらのいずれも眼の連続的・空間的な適応応答を完全には再現しないが、その差は著しく縮小している。最良の現行フルフレームミラーレスセンサーは、段階的な調整を加えた慎重なRAWポスト処理において、同一の場面に立つ正常視力の観察者が知覚するであろうものに近似した結果を生成できる。
眼とカメラの比較は、眼が走査型で適応的かつ神経的に処理された映像システムであるという事実によって複雑化する ― 単一ショットのキャプチャ装置ではない。引用されるいかなる段数も、瞬間的か適応的か、空間的か時間的かを明示しなければならない。
— Cambridge in Colour, Cameras vs. The Human Eye量子の最前線
単光子センサー、QISチップ、そして撮像技術の未来
次世代の撮像技術は絶対的な物理的限界 ― 個々の光子の検出 ― へと迫り、その影響は民生用カメラから量子暗号、医療診断にまで及ぶ。
従来のカメラセンサーは光子を束として計数する ― 各フォトサイトは一回の露光で数千から数百万の光子を蓄積し、単一の平均値を報告する。これは通常条件下では優れた機能を発揮するが、量子レベルの情報を捨象し、極端な低照度環境での性能を制限するノイズフロアを設定する。撮像における次の境界は、この限界を超えることを目指す ― 個々の光子の到達事象を検出・記録するセンサーへの挑戦である。
この境界に向けた最初の一歩はすでに商業生産の段階にある。2018年、Dartmouth Collegeの研究者らは量子画像センサー(QIS)を発表した:各サブピクセル要素 ― ジョットと呼ばれる ― が非常に小さく高感度であるため、単一光子を検出できるセンサーアーキテクチャである。✓ Established [5] 従来のフォトサイトのように滑らかな電荷勾配を報告するのではなく、各ジョットは二値信号を出力する:光子を検出したか否か。完全な画像は、多数のジョットと時間ステップにわたって集計された、数十億のこれらの二値事象の統計的アンサンブルから構成される。その結果、光そのものの粒子的性質によって設定される理論的限界 ― 量子ノイズフロア ― において動作する撮像システムが実現する。
感度の極限においては、超伝導ナノワイヤ単光子検出器(SNSPD)が存在する。これはNIST(米国国立標準技術研究所)において開発・精緻化されてきたものである。これらの装置は、絶対零度近傍まで冷却された超伝導材料のナノメートルスケールのワイヤから構成され、持続的な電流を担持する。✓ Established 単一光子がナノワイヤに衝突すると、超伝導状態を破壊するに足る十分なエネルギーを付与し、測定可能な電気的パルスを発生させる。ワイヤは次いで速やかに超伝導状態に復帰し、次の光子に備える。[12]
単光子検出技術から広がる応用は多岐にわたり、重大な意義を持つ。医療画像診断においては、光子計数型CTスキャナーが大型検出素子にわたる平均化ではなくすべてのX線光子から最大限の情報を抽出するため、劇的に低い放射線量で画像を生成できる。自律走行車および防衛応用向けのLiDARシステムにおいては、単光子検出器が従来の検出器では不可能な測距・撮像を実現する。量子暗号においては、SPDは量子鍵情報を符号化する個々の光子を検出するために不可欠であり ― その検出事象は物理法則上、偽造不可能である。
民生用写真の観点においては、その方向性は、読み出しノイズを漸進的に低減する大型センサーへと向かっており、画素あたりのノイズフロアを光子の確率的到達によって設定される不可避の量子ノイズであるショットノイズ限界へと近づけつつある。一部の現行ミラーレスカメラはすでに特定の読み出しモードにおいて1電子以下の読み出しノイズを達成しており、これは支配的なノイズ源がもはや電子回路ではなく光子統計そのものであることを意味する。この閾値が普遍的に超えられた時、センサー工学はその根本的な物理的限界に到達したことになる。
アインシュタインの1905年の論文から今日の量子撮像センサーへと至る軌跡は、現代科学における最も明確な事例の一つである ― 純粋に理論的な動機から追求された根本的な発見が、やがて世界的産業の基盤となるという過程の。スマートフォン上で撮影されるすべての写真、すべてのプロ向けミラーレスカメラで捉えられるすべてのフレーム、すべての防犯カメラの映像、すべての天体望遠鏡の画像が、毎秒数十億回にわたって光電効果を実行している。光子が到達する。電子が解放される。画像が始まる。
これを ― 比喩としてではなく実際の物理として ― 理解することは、カメラとの関係を根本から変容させる。露出のトライアングルは恣意的なダイヤルの集合ではない:それはフォトサイトごとの光子収集を制御する三変数の制御システムである。センサーノイズはカメラの欠陥ではない:それは光の量子確率論的な性質が、画像の中に肉眼で視認できる形で現れたものである。そして来たる単光子センサーの波は、単なるマーケティング上のアップグレードではない:それは撮像技術が物理的可能性の壁に到達しつつある実相であり、その唯一の限界は光そのものに組み込まれた、還元不可能な不確定性である。
2. 光電効果は歴史ではなく、今まさにカメラの中で進行している。 アインシュタインの1905年のノーベル賞受賞の発見は、すべてのデジタル写真の物理的メカニズムである。
3. Bayerフィルターは入射光の約67%を廃棄する。 カラーデジタルカメラは本質的に補間的な装置である。これを理解することは、デモザイク処理のアーティファクトとセンサー設計のトレードオフを説明する。
4. フィルムとデジタルは程度の差ではなく、種類の差がある。 フィルムのアナログ的な階調曲線、連続的な色彩階調、粒子の性格は、単純にデジタルの劣位版ではなく ― 異なる美的特性を持つ、物理的に異質な応答である。
5. 眼のダイナミックレンジの優位性は時間的なものであり、瞬間的なものではない。 いかなる単一の瞬間においても、現代のフルフレームセンサーは人間の眼と真に競合し得る。眼の優位性はその時間をかけた適応的走査にある。
6. 量子撮像は次の最前線である。 QISチップ、SNSPD、光子計数検出器は撮像を物理的限界へと押し進めており、その影響は写真の域をはるかに超え、医学、量子コンピューティング、安全保障へと及ぶ。