제2회 테샛 시험도 시험의 질적 수준이 매우 높은 것으로 나타났다. 한경 경제교육연구소가 2회 성적을 분석한 결과 시험을 평가하는 각종 신뢰도와 타당도 검사에서 매우 높은 점수를 기록했다. 한경은 테샛 시험의 신뢰도와 타당성을 높이기 위해 다양한 기법으로 문제를 출제하고 통계 처리하고 있다.

우선 성적 상위자의 오답과 성적 하위자의 정답률이 높은 문항을 비교 평가한 신뢰성 계수(알파 크론바흐 지수)가 0.82로 1차 시험 0.77보다 높게 나타났다. 알파 크론바흐 지수는 상위 20%와 하위 20%의 상관성을 측정하는 지수로 상위 20%에 속한 응시자의 정답률이 높은 문제를 하위 20%에서 오답률이 높은 경우는 정상이지만 상위 20%의 오답률이 높은 문제를 하위 20%에서 정답률이 높은 경우라면 비정상으로 간주하는 변별력 평가 방법이다. 이 신뢰성 지수의 최고치는 1.0으로 일반적으로 0.7 이상이면 적정, 0.8 이상이면 양호한 것으로 보고 있다.

또 각 영역별 점수와 종합 점수의 상관성을 평가하는 피어슨(Pearson) 상관계수도 경제 0.84,시사 0.82,상황판단 0.8로 고른 분포를 보였다.

이는 테샛이 한 영역에 치우침 없이 수험생들의 경제 지력을 골고루 평가하는 잣대로 충분한 균형성을 갖춘 것으로 설명된다.

일반적으로 각종 평가시험들이 각 영역별 난이도 조정에 실패해 피어슨 상관계수가 고르지 못하게 나오는 경우를 흔히 볼 수 있지만 테샛은 이를 극복한 것이다.

테샛은 표준편차치에 의한 표준점수를 위주로 시험을 평가하는 다른 시험과는 달리 문항반응이론(IRT)기법에 맞춰 시험의 적정성을 평가하고 있다. IRT 기법은 문항별 난이도와 변별도를 근거로 성적을 산출하는 측정 기법으로 문항별로 측정 내용의 통계적 특성을 미리 조사해 둔 다음 시험 점수를 평균화하는 방식이다. 선진국에선 이 방식을 많이 활용하고 있다. 한경 경제교육연구소는 테샛 시험의 신뢰도를 더욱 높이기 위해 선진 평가기법을 지속적으로 발굴해 활용할 계획이다.