SW 품질 평가 지표/기준에 대해 고민해보는 시간을 가져볼까 합니다.
우리가 SW를 많이 개발하고 있지만 이정도의 지표를 지킨다면 좀 더 좋은 소프트웨어를 만들 수 있다??
뭐 이런 느낌의 글 입니다.
좋은 소프트웨어란?
좋은 소프트웨어란 무엇일까요?
아무래도 구현이 잘 되어 있는지, 신뢰성이 있는지, 사용성이 편한지, 유지보수성이 좋은지, 빠르게 동작하는지, 이식성이 좋은지, 보안성이 보장되는지 등을 만족하는 SW일 것입니다.
다시 정리해보면, 모듈의 복잡도는 낮추고, 모듈의 독립성은 높이고, 모듈의 결함은 없고, 모듈의 공용성을 높이면 SW는 좋다고 할 수 있을 것 입니다.
SW 품질이 나빠지는 원인은?
SW 품질이 나빠지는 원인은 뭘까요?
자꾸 신규 기능이 추가되거나 요구사항이 변경되거나 일정 단축 등의 이유로 코드의 품질, 설계에 신경을 쓰지 못하고 당면한 이슈 해결을 빨리 수정하는 방법으로만 처리 하다 보니까 품질이 나빠집니다.
SW 품질을 평가한다?
그럼, 품질을 평가한다는 것은 무엇일까요?
평가하기 위해서는 정량적인 지표가 있어야 합니다.
이번에는 그 정량적인 지표에 대해 소개하려고 하는데, 인터넷 어디에도 없는 정량 지표일 듯 합니다.
하지만 정답은 없기 때문에 정답은 아니라는거. 제가 SW 개발을 하면서 회사에서 또는 제가 느낀 것을 공유할까 합니다.
코딩 시 고려해야 할 것들
1. 모듈의 복잡도 ↓
내부 로직의 복잡도를 낮춤으로써 수정을 용이하게 하고 테스트 비용을 감소시키는 것 입니다.
내부 로직의 복잡도를 낮추려면, 함수 복잡도와 함수 코드 라인수, 파일 코드 라인수 등을 적절하게 해야 합니다.
1.1 함수 복잡도, 함수 라인 수
함수 복잡도가 높은 것은, 제어문과 분기문이 많은 경우이고, 이런 경우 대부분 함수 라인 수가 길어집니다.
함수의 복잡도가 높으면 (함수 라인 수가 길면) 코드 이해도를 떨어뜨려 잠재적 결함 발생률이 높아질 수 있죠.
그럼 어떻게 하느냐?
논리 단위에 따라 함수를 만들고 조건을 단순화 시키고 불필요한 조건문을 제거하면 됩니다.
함수 복잡도 수준 측정은 프로그램의 독립적 실행 경로의 수를 의미합니다.
#define IF(X) if(X) 1; else if (!X) 2; else 3;
int main() {
int x = 1;
int y = 2;
int z = 0;
if(x < y) z = x;
else z = y;
IF((Z < 2))
switch (z) {
case 1:
break;
default:
break;
}
return 0;
}
위와 같은 코드가 있다면
함수 복잡도는 아래와 같이 분기문 수를 계산하여
4라고 할 수 있습니다.
한 함수의 복잡도가 10이 넘으면 복잡하다고 할 수 있죠.
아래와 같은 코드가 있다면 함수의 라인 수는
#define ADD(X, Y) { \
(x) + (Y) \
}
int main() {
// test code
int x =
ADD(1, 2);
return 0;
}
매크로 정의, 공백, 주석 제외하여 총 코드 라인 수는 5라인이 됩니다.
한 함수가 60 라인이 넘어가면 가독성과 이해도를 저하시킨다고 합니다.
여기에서 중요한 것은, 복잡도 지표만을 개선하기 위해 함수를 계속 만든다면 오히려 이해가 더 어려워질 수 있습니다.
함수의 이름은 주석을 보지 않고도 이해할 수 있도록 해야 하고, 전달 인자가 많은 함수는 사용이 어렵고 메모리 사용에
영향을 미칠 수 있기 때문에 다른 방법을 고민해 보는 게 중요합니다.
1.2 파일 라인 수, 파일 함수 개수
하나의 파일을 구성하는 코드 라인 수와 파일의 함수 개수를 따져 보는 것 입니다. 즉, 거대한 클래스를 만들지 말고
클래스는 하나의 책임과 그를 위한 최소한의 서비스만을 제공하는 것이 목적입니다. 클래스가 책임이 많으면 변경 및 재사용이 어려워지고, 다른 모듈에 영향을 미치는 경우가 많아집니다.
그럼 어떻게 하느냐?
수행해야 할 책임에 따라 클래스를 명확히 나누고 내부 클래스를 명시적인 외부 클래스로 추출하면 됩니다.
하나의 파일의 라인수를 카운트 했을 때, 1,000 라인이 넘어간다.
그럼 작업 단위가 커져서 효율적 업무 분배가 어려워지고, 재사용성이 떨어질 수 있다고 보시면 됩니다.
하나의 파일에 함수의 개수가 50개가 넘어간다. 그럼 모듈의 역할을 제대로 정의되지 않았다고 판단할 수 있고,
유지보수 비용도 증가될 수 있습니다.
1.3 중복 코드 비율
코드에는 중복이 없어야 합니다.
코드 내에 중복 코드가 많을 경우 수정 내역을 여러 곳에 일일이 반영해야 하고, 반영 과정에서 누락이 발생하여 버그로 돌아올 수 있습니다.
그럼 어떻게 하느냐?
중복된 코드는 하나의 함수로 만들고, 자식 클래스의 동일 코드를 부모 클래스로 이동하고, 클래스화를 시키면 됩니다.
중복코드는 리팩토링에서 가장 심각한 코드 악취로 분류합니다.
중복코드 측정은, 약 5~10라인이 연속적으로 일치하는 경우를 중복코드로 판단할 수 있습니다.
중복코드 비율은
로 표현할 수 있고, 중복코드는 0%가 되어야 합니다.
1.4 미사용 변수 비율
코딩을 하다 보면, 미사용 변수가 생길 수 있다. 이는 추후 코드의 가독성을 떨어뜨릴 뿐만 아니라 코드가 오용될 수 있는 소지가 있습니다.
그럼 어떻게 하느냐?
사용하지 않는 임시 변수는 삭제하고 로직 부분이 제거되는 경우, 관련된 변수도 반드시 삭제하는 습관을 들이면 됩니다.
미사용 변수 중 디버깅을 위한 문자열, 디버깅 코드, enum 변수 등은 예외로 생각할 수 있습니다.
특히 enum 같은 경우, POWER_ON = 1 만 사용하더라도 POWER_OFF = 2 라는 값을 남겨두는 것이 좋습니다.
다음부터 설명할 내용은 설계와 관련된 것으로, 약간은 어려울 수 있어서 간략하게 설명하기로 합니다.
2. 상호 참조 비율 개선
시스템 상의 특정 두 파일 또는 클래스가 서로를 사용하고 있을 경우를 상호 참조라고 합니다.
상호 참조 비율이 높으면 모듈의 독립성이 저하되고, 모듈별 테스트와 배포가 어려워집니다. 상호 참조는 아래와 같이
직접 상호 참조와 간접 상호 참조가 있습니다.
상호 참조 비율은
만약 A, B, C, D, E 다섯개의 파일로 구성된 시스템을 예로 들면,
다음과 같은 파일간 의존 관계가 있을 경우 상호 참조 비율을 구해보면,
상호 참조하는 파일 쌍의 개수(n): 1개 (B ↔ C) 파일 수(v) = 5 가능한 상호 참조 경우의 수 A = v(v-1)/2 = 10
상호 참조 비율은, n/A x 100 = 1/10 x 100 = 10%
그럼 어떻게 하느냐?
상위 구조를 사용하여 최소한의 인터페이스를 제공하던지,
현재 함수가 자신이 정의된 클래스보다 다른 클래스의 기능을 더 많이 사용하고 있다면, 그 클래스로 이동 시키던지,
클래스 A와 B간 상호 참조가 존재한다면, A가 호출하는 모든 함수를 포함하며 클래스 B에 의해 구현되는
새로운 인터페이스를 도입하면 됩니다.
상호 참조 비율은 3% 이내를 권장합니다.
3. 변경 영향도 개선
변경 영향도란 시스템 상의 특정 파일의 변경으로 인해 영향을 받는 다른 파일들의 비율을 말합니다.
변경 영향도가 높으면 코드 변경 시 수정해야 할 대상이 많아지기 때문에 관리가 되어야 합니다.
Impact: 내가 변경될 때 영향을 받는 파일의 개수는 A = 0, B = 1, C = 2, D = 0, E = 0
Average Impact: 파일들의 Impact 평균 값은 (0 + 1 + 2 + 0 + 0)/5 = 3/5, 변경 영향도는 (3/5)/5 = 12%
변경 영향도는 10% 이내로 관리되는 것을 권장합니다.
그럼 어떻게 하느냐?
변경이 집중되는 God 클래스를 식별하여 제거하거나
Average Impact를 높이는 dependency cycle을 제거하면 됩니다.
그럼 지금까지 언급한 내용을 정리해보면, 아래와 같이 정리 됩니다.
평가 지표
|
기준 값
|
시사점
|
함수 복잡도
|
10↓
|
복잡도가 높으면 코드 이해도를 떨어뜨려 잠재적 결함 발생율이 높아짐
|
함수 라인 수
|
60라인↓
|
코드 라인수가 길면 코드 가독성과 이해도를 저하시켜 잠재적 결함 발생율이 높아짐
|
파일 라인 수
|
1000라인↓
|
파일이 너무 크면 작업 단위가 커져서 효율적 업무 분배가 어려워지며, 향후 변경 또는 재사용이 어려울 수 있음
|
파일 함수 개수
|
50개↓
|
너무 많은 함수 개수는 모듈의 역할 정의가 적절치 않음을 의미함, 이로 인해 재사용이 어렵고 유지 보수 비용이 증가하게 됨
|
중복 코드 비율
|
0%
|
중복 코드가 있으면 코드 변경 시 누락되는 부분이 발생하여 결함이 발생할 수 있음
|
미사용 변수 비율
|
0%
|
사용하지 않는 변수가 많아지면 코드 내에서 오용될 가능성이 높아져 결함 발생 가능성을 높임
|
상호 참조 비율
|
3%↓
|
파일 간의 상호 참조 비율이 높으면 시스템을 모듈화 하기 어렵고, 독립적인 빌드 및 테스트 수행이 어려울 수 있음
|
변경 영향도
|
10%↓
|
특정 파일의 변경으로 영향을 받는 다른 파일들의 비율로 변경 영향도가 높으면 기능 변경과 업그레이드 시 고려할 대상이 많아져 개발 기간과 결함 발생 가능성이 증가할 수 있음
|
다시 말씀드리지만, 여기에서 기준 값은 절대 값은 아니며, SW 개발 규모와 특성에 따라서도 달라질 수 있습니다.
각자 개발을 하실 때 내부 규칙을 세우셔서 접근하시면 좀 더 이해하기 쉽고 모듈화 된 코드를 생산하실 수 있을 것 입니다.
여기서 잠깐, 이번에 다루지 않았지만 소프트웨어 개발하면서 UnitTest, Code Coverage, 정적 분석, 코딩룰 체크 등은 기본적으로 챙겨야 하는 것들 인것도 아시죠?