이미지 품질의 정량적 측정 방법 (quantitative measurement of Image quality)

MSE(Mean Square Error)

$$ MSE = \frac{1}{n}\sum_{i=1}^n(\hat{Y_i}-Y_i)^2 $$

2차원으로 표현하면

$$ MSE = \frac{1}{mn}\sum_{i=0}^{m-1}\sum_{j=0}^{n-1}[I(i,j)-K(i,j)]^2 $$

말그대로 오차의 제곱의 평균

오차가 작을수록 MSE가 작고 추측한 값이 원본에 가깝다

예측값과 실제값 차이의 면적의 평균

PSNR(Peak Signal to Noise Ratio)

$$ PSNR = 10\log\frac{s^2}{MSE} \quad[db] $$

$s$ = (해당채널의)픽셀최댓값-픽셀최솟값

만약 8bit gray이미지라면 255가 픽셀 최댓값, 0이 최솟값이므로 $s$=255

MSE가 작을수록 높은 값을 가지므로, 손실이 적을수록 높은 값을 가진다. 즉 값이 높을수록 복원이 잘 된 것이라고 볼 수 있겠다

<aside> 💡 PSNR도 결국 MSE를 사용하는 것인데 어떤 차이가 있을까? MSE는 단순히 두 이미지간의 Euclidean metric을 나타내는 것이고, 이는 peak intensity나 encoding bits의 수를 모르면 의미가 없다. 상대적인 정도를 알 수 없기 때문이다. e.g. [0 1]의 값을 가지는 이미지와 [0 255]를 가지는 이미지의 MSE가 똑같이 240이라면, 이는 같은 중요도를 가지지 않을 것이다. 따라서 PSNR에서는 peak intensity를 사용함으로써 이러한 문제를 해결하는 것이다 간단히 말해 ‘값'이 아닌 ‘비율'로써 나타내는 것이라고 이해할 수 있을 것 같다

또한 log연산으로 적은 숫자로 값을 나타낼 수 있는 것도 MSE와의 차이라고 할 수 있겠다.

</aside>

RGB 이미지 ( 3채널 이미지 ) 같은 여러 채널을 가진 이미지에서 PSNR 구하기

SSIM(Structural Similarity Index Map)

수치적 에러가 아닌 인간의 시각적 화질 차이 및 유사도를 평가하기 위해 고안한 방법

사람의 시각시스템은 이미지의 구조정보 도출에 특화되어있기 때문에 구조정보의 왜곡 정도가 지각에 큰 영향을 미친다는 것이 SSIM의 핵심 가설

원본 이미지 A와 왜곡된 이미지 B가 있을 때 SSIM은 두 이미지의 휘도, 대비, 구조를 비교한다.

어떠한 이미지 x와 y를 비교할 때