클린코드 스터디 - 006
6장 객체와 자료 구조
변수를 비공개로 정의하는 이유가 있다. 남들이 변수에 의존하지 않게 만들고 싶어서다.
자료 추상화
변수 사이에 함수라는 계층을 넣는다고 구현이 저절로 감춰지지 않는다.
구현을 감추려면 추상화가 필요하다!
그저 (형식 논리에 치우쳐) 조회 함수와 설정함수로 변수를 다룬다고 클래스가 되지는 않는다.
그보다는 추상 인터페이스를 제공해 사용자가 구현을 모른 채 자료의 핵심을 조작할 수 있어야 진정한 의미의 클래스다.
// 6-3 구체적인 Vehicle 클래스
public interface Vehicle {
double getFuelTankCapacityInGallons();
doubble getGallonsOfGasoline();
}
// 6-4 추상적인 Vehicle 클래스
public interface Vehicle {
double getPercentFuelRemaing();
}
목록 6-3과 목록 6-4를 살펴보자.
목록 6-3은 자동차 연료 상태를 구체적인 숫자 값으로 알려준다.
목록 6-4는 자동차 연료 상태를 백분율이라는 추상적인 개념으로 알려준다.
목록 6-3은 두 함수가 변수값을 읽어 반환할 뿐이라는 사실이 거의 확실하다.
목록 6-4는 정보가 어디서 오는지 전혀 드러나지 않는다.
자료를 세세하게 공개하기보다는 추상적인 개념으로 표현하는 편이 좋다.
인터페이스나 조회/설정 함수만으로는 추상화가 이뤄지지 않는다.
개발자는 객체가 포함하는 자료를 표현할 가장 좋은 방법을 심각하게 고민해야 한다.
아무 생각없이 조회/설정 함수를 추가하는 방법이 가장 나쁘다.
자료/객체 비대칭
앞서 소개한 두 가지 예제는 객체와 자료 구조사이에 벌어진 차이를 보여준다.
객체는 추상화 뒤로 자료를 숨긴 채 자료를 다루는 함수만 공개한다.
자료 구조는 자료를 그대로 공개하며 별다른 함수는 제공하지 않는다.
문단을 처음부터 다시 읽어보기 바란다. 두 정의는 본질적으로 상반된다. 두 개념은 사실상 정반대다.
사소한 차이로 보일지 모르지만 그 차이가 미치는 영향은 굉장하다.
p.120 의 Geometry 클래스는 세 가지 도형 클래스를 다룬다. 각 도형 클래스는 간단한 자료 구조다. 즉, 아무 메서드도 제공하지 않는다. 도형이 동작하는 방식은 Geometry 클래스에서 구현한다.
클래스가 절차적이라 비판한다면 맞는 말이다. 하지만 그런 비웃음이 100% 옳다고 말하기는 어렵다.
만약 Geometry 클래스에 둘레 길이를 구하는 perimeter() 함수를 추가하고 싶다면? 도형 클래스는 아무 영향도 받지 않는다!
도형 클래스에 의존하는 다른 클래스도 마찬가지다! 반대로 새 도형을 추가하고 싶다면? Geometry 클래스에 속한 함수를 모두 고쳐야 한다.
p.121 을 살펴보자. 객체 지향적인 도형 클래스다. 여기서 area()는 다형메서드다.
Geometry 클래스는 필요 없다. 그러므로 새 도형을 추가해도 기존 함수에 아무런 영향을 미치지 않는다.
반면 새 함수를 추가하고 싶다면 도형 클래스를 전부 고쳐야 한다.
객체와 자료 구조는 근본적으로 양분된다.
(자료 구조를 사용하는) 절차적인 코드는 기존 자료 구조를 변경하지 않으면서 새 함수를 추가하기 쉽다.
반면, 객체 지향코드는 기존 함수를 변경하지 않으면서 새 클래스를 추가하기 쉽다.
반대쪽도 참이다.
절차적인 코드는 새로운 자료 구조를 추가하기 어렵다. 그러려면 모든 함수를 고쳐야 한다.
객체 지향 코드는 새로운 함수를 추가하기 어렵다. 그러려면 모든 클래스를 고쳐야 한다.
다시 말해, 객체 지향 코드에서 어려운 변경은 절차적인 코드에서 쉬우며, 절차적인 코드에서 어려운 변경은 객체 지향 코드에서 쉽다!
복잡한 시스템을 짜다 보면 새로운 함수가 아니라 새로운 자료 타입이 필요한 경우가 생긴다. 이때는 클래스와 객체 지향 기법이 가장 적합하다.
반면, 새로운 자료 타입이 아니라 새로운 함수가 필요한 경우도 생긴다. 이때는 절차적인 코드와 자료구조가 좀 더 적합하다.
때로는 단순한 자료구조와 절차적인 코드가 가장 적합한 상황도 있다.
디미터 법칙
디미터 법칙은 잘 알려진 휴리스틱으로, 모듈은 자신이 조작하는 객체의 속사정을 몰라야 한다는 법칙이다.
앞 절에서 봤듯이, 객체는 자료를 숨기고 함수를 공개한다.
즉, 객체는 조회 함수로 내부 구조를 공개하면 안 된다는 의미다.
다음 코드는 디미터 법칙을 어기는 듯이 보인다.
Final String outputDir = ctxt.getOptions().getScratchDir().getAbsolutePath();
기차 충돌
흔히 위와 같은 코드를 기차 충돌이라 부른다. 여러 객체가 한 줄로 이어진 기차처럼 보이기 때문이다. 일반적으로 조잡하다 여겨지는 방식이므로 피하는 편이 좋다.
위 코드는 다음과 같이 나누는 편이 좋다.
Options opts = ctxt.getOptions();
File scratchDir = opts.getScratchDir();
Final String outputDir = scratchDir.getAbsolutePath();
방금 살펴본 코드 예제는 둘 다 디미터 법칙을 위반할까?
확실히 위 코드 형태로 구현된 함수는 ctxt 객체가 Options을 포함하며, Options가 ScratchDir을 포함하며, ScratchDir이 AbsolutePath를 포함한다는 사실을 안다.
함수 하나가 아는 지식이 굉장히 많다. 위 코드를 사용하는 함수는 많은 객체를 탐색할 줄 안다는 말이다.
위 예제가 디미터 법칙을 위반하는지 여부는 ctxt, Options, ScratchDir이 객체인지 아니면 자료 구조인지에 달렸다.
객체라면 내부 구조를 숨겨야 하므로 확실히 디미터 법칙을 위반한다. 반면, 자료 구조라면 당연히 내부 구조를 노출하므로 디미터 법칙이 적용되지 않는다.
그런데 위 에제는 조회 함수를 사용하는 바람에 혼란을 일으킨다. 코드를 다음과 같이 구현했다면 디미터 법칙을 거론할 필요가 없어진다.
Final String outputDir = ctxt.options.scratchDir.absolutePath;
자료 구조는 무조건 함수 없이 공개 변수만 포함하고 객체는 비공개 변수와 공개 함수를 포함한다면, 문제는 훨씬 간단하리라.
하지만 단순한 자료 구조에도 조회 함수와 설정 함수를 정의하라 요구하는 프레임워크와 표준(예, ‘Bean’)이 존재한다.
잡종 구조
이런 혼란으로 말미암아 때떄로 절반은 객체, 절반은 자료 구조인 잡종 구조가 나온다.
잡종 구조는 중요한 기능을 수행하는 함수도 있고, 공개 변수나 공개 조회/설정 함수도 있다.
공개 조회/설정 함수는 비공개 변수를 그대로 노출한다.
덕택에 다른 함수가 절차적인 프로그래밍의 자료 구조 접근 방식처럼 비공개 변수를 사용하고픈 유혹에 빠지기 십상이다.
이런 잡종 구조는 새로운 함수는 물론이고 새로운 자료 구조도 추가하기 어렵다.
양쪽 세상에서 단점만 모아놓은 구조다. 그러므로 잡종 구조는 되도록 피하는 편이 좋다.
프로그래머가 함수나 타입을 보호할지 공개할지 확신하지 못해 (더 나쁘게는 무지해) 어중간하게 내놓은 설계에 불과하다.
구조체 감추기
만약 ctxt, options, scratchDir이 진짜 객체라면? 그렇다면 앞서 코드 예제처럼 줄줄이 사탕으로 엮어서는 안 된다.
객체라면 내부 구조는 감춰야 하니까. 그렇다면 임시 디렉터리의 절대 경로는 어떻게 얻어야 좋을까?
다음 두 코드를 살펴보자.
ctxt.getAbsolutePathOfScratchDirectoryOption();
Cox.getScratchDirectoryOption().getAbsolutePath();
첫 번째 방법은 ctxt 객체에 공개해야 하는 메서드가 너무 많아진다.
두 번째 방법은 getScratchDirectoryOption()이 객체가 아니라 자료 구조를 반환한다고 가정한다.
어느 방법도 썩 내키지 않는다.
ctxt가 객체라면 뭔가를 하라고 말해야지 속을 드러내라고 말하면 안 된다. 임시 디렉터리의 절대 경로가 왜 필요할까? 절대 경로를 얻어 어디에 쓰려고?
임시 디렉터리의 절대 경로를 얻으려는 이유가 임시 파일을 생성하기 위한 목적이라면, ctxt 객체에 임시 파일을 생성하라고 시키면 어떨까?
BufferedOutputStream bos = ctxt.createScratchFileStream(classFilename);
객체에 맡기기에 적당한 임무로 보인다!
ctxt는 내부 구조를 드러내지 않으며, 모듈에서 해당 함수는 자신이 몰라야 하는 여러 객체를 탐색할 필요가 없다. 따라서 디미터 법칙을 위반하지 않는다.
자료 전달 객체
자료 구조체의 전형적인 형태는 공개 변수만 있고 함수가 없는 클래스다.
이런 자료 구조체를 때로는 자료 전달 객체(DTO)라 한다.
DTO는 굉장히 유용한 구조체다. 특히 데이터베이스와 통신하거나 소켓에서 받은 메시지의 구문을 분석할 때 유용하다.
흔히 DTO는 데이터베이스에 저장된 가공되지 않은 정보를 애플리케이션 코드에서 사용할 객체로 변환하는 일련의 단계에서 가장 처음으로 사용하는 구조체다.
좀 더 일반적인 형태는 ‘빈(bean)’ 구조다. 예제는 목록 6-7을 참조한다.
빈은 비공개(private) 변수를 조회/설정 함수로 조작한다. 일종의 사이비 캡슐화로, 일부 OO 순수주의자나 만족시킬 뿐 별 다른 이익을 제공하지 않는다.
활성 레코드
활성 레코드는 DTO의 특수한 형태다. 공개 변수가 있거나 비공개 변수에 조회/설정 함수가 있는 자료 구조지만, 대개 save나 find와 같은 탐색 함수도 제공한다.
활성 레코드는 데이터베이스 테이블이나 다른 소스에서 자료를 직접 변환한 결과다. 불행히도 활성 레코드에 비즈니스 규칙 메서드를 추가해 이런 자료 구조를 객체로 취급하는 개발자가 흔하다. 하지만 이는 바람직하지 않다. 그러면 자료 구조도 아니고 객체도 아닌 잡종 구조가 나오기 때문이다.
해결책은 당연하다. 활성 레코드는 자료 구조로 취급한다. 비즈니스 규칙을 담으면서 내부 자료를 숨기는 객체로 따로 생성한다. (여기서 내부 자료는 활성 레코드의 인스턴스일 가능성이 높다.)
결론
객체는 동작을 공개하고 자료를 숨긴다. 그래서 기존 동작을 변경하지 않으면서 새 객체 타입을 추가하기는 쉬운 반면, 기존 객체와 새 동작을 추가하기는 어렵다.
자료 구조는 별다른 동작 없이 자료를 노출한다. 그래서 기존 자료 구조에 새 동작을 추가하기는 쉬우나, 기존 함수에 새 자료 구조를 추가하기는 어렵다.
시스템을 구현할 때, 새로운 자료 타입을 추가하는 유연성이 필요하면 객체가 더 적합하다.
다른 경우로 새로운 동작을 추가하는 유연성이 필요하면 자료 구조와 절차적인 코드가 더 적합하다.
우수한 소프트웨어 개발자는 편견 없이 이 사실을 이해해 직면한 문제에 최적인 해결책을 선택한다.