#include
using namespace std;
//1) 기본 템플릿
//primary template(주 템플릿)
template class Stack
{
T buff[10];
public:
void push() {cout << "push(T)" << endl;}
};
//2) 부분적인 타입에 특화된 템플릿을 사용하고 싶다면?
//partial specialization(부분 전문화)
template class Stack
{
T buff[10];
public:
void push() {cout << "push(T*)" << endl;}
};
//3) 특정 타입에 특화된 템플릿을 사용하고 싶다면?
//specialization(전문화)
template<> class Stack //를 삭제한다.
{
char* buff[10]; //T를 특정 타입으로 변경한다.
public:
void push() {cout << "push(char*)" << endl;}
};
void main()
{
Stack s1;
s1.push(); //T
Stack s2; //c++에서는 포인터도 타입으로 인지한다.
s2.push(); //T*
Stack s3;
s3.push(); //char*
}
정리 :
모든 타입에 대해서 처리할 수 있는 템플릿을 primary template이라 하고
부분 타입에 대해서 처리할 수 있는 템플릿을 partial specialization 이라 한다.
특정 타입에 대해서 처리할 수 있는 템플릿을 specialization 이라 한다.
왜 필요한가??(template meta programming 의 장점)
예를 들어, 5!(factorial)의 값을 얻으려 할 때,
loop 혹은 recursive code는 run time 에 동작한다.
하지만 class template과 function template 은 compile time에 동작하고
따라서 partial specialization과 specialization 을 이용하면 runtime이 아닌 compile time에 작업을 처리할 수 있다.
#include
using namespace std;
class Stack
{
int buff[10];
public:
void push(int data){}
int pop() {return 0;}
};
void main()
{
Stack s;
s.push(55); //int
s.push(10.123); //double ??
}
Stack에 저장되는 data가 integer type이 아닌 double 형 type으로 바꾸길 원한다면..?
#include
using namespace std;
template class Stack
{
T buff[10];
public:
void push(T data){}
T pop() {return 0;}
};
void main()
{
Stack s;
s.push(10.123);
}
template을 사용하여 type에 의존적인 부분을 변경한다.
class template은 function template과 달리 암시적 추론이 되지 않는다.
Stack s; 로 선언한것은 완전하지 않다.
따라서 Stack<double> s;와 같이 상세 type을 적어야 한다.
#include
using namespace std;
int Max(int a, int b) {return a > b ? a : b;}
double Max(double a, double b) { return a > b ? a : b; }
void main()
{
printf("%d\n", Max(1, 2));
printf("%f\n", Max(10.22, 2.34));
}
type 에 따라 각 함수를 정의하는 것은 비효율적이다.
#include
using namespace std;
#define MAKE_MAX(T) T Max(T a, T b) { return a > b ? a : b; }
MAKE_MAX(int)
MAKE_MAX(double)
void main()
{
printf("%d\n", Max(1, 2));
printf("%f\n", Max(10.22, 2.34));
}
매크로를 이용하여 타입을 정의할 수 있고 좀 더 효율적이다.
하지만, 매크로는 컴파일러가 아닌 전처리기가 다루는 것이기 때문에 문제점이 있다.
(e.g, 이항연산자 처리 시 문제가 발생한다. 전처리기는 타입 체크를 하지 않는다.)
#include
using namespace std;
template T Max(T a, T b) { return a > b ? a : b; }
void main()
{
//printf("%d\n", Max('A', 2)); //error
printf("%d\n", Max('A', 2));
}
매크로를 template 으로 변경한다.
template은 컴파일러가 다루는 부분이고, 타입 체크를 할 수 있고 이항연산자 문제를 해결할 수 있다.
printf("%d\n", Max('A', 2));
위 코드에서 'A'는 ASCII 코드 65로 처리되지 않는다.
template function 을 사용할 때, 타입을 명시적으로 선언해줘야
컴파일러가 그 타입에 맞게 변경하여 template function 을 호출하게 된다.
정리 :
함수 템플릿은 템플릿의 인자를 생략하는데,
이는 컴파일러가 컴파일 타임에 타입을 추론하여(암시적)
기계어 코드를 생성하므로 굳이 타입을 명시적으로 사용할 필요가 없다.
다만, 사용자가 템플릿 타입을 명시적으로 사용하고 싶다면 아래와 같이 타입을 선언해서 쓸 수 있다.
printf("%d\n", Max<int>('A', 2));
Android Framework에서도 IBinder를 asInterface 로 제공하는데
Google 에서 interface_cast(binder); 를 사용하여 제공하도록 개선하였다.
결국엔 interface_cast 도 function template이다.
Smart Pointer
: 포인터처럼 동작하며 자동으로 메모리를 해제하고 안전하게 resource를 관리하도록 돕는 객체
포인터는 소멸자가 호출되지 않아 memory leak이 발생한다.
Java, C#같은 VM이 있는 언어는 VM에서 Garbage collector가 leak 이 발생하는 메모리를 해제시킨다.
C++에서도 자동으로 메모리를 해제하는 기법을 개발하게 되는데 이것이 smart pointer이다.
Sptr이 진짜 pointer라면 -> 연산자가 동작해야하는데 동작하지 않는다.
p.operator->()go(); 이렇게 처음에 바뀌지만 문법에 맞지 않아서 컴파일러는 아래와 같이 바꾼다.
(p.operator->())->go();
따라서 -> 연산자를 재정의해야 한다.
* 이것도 마찬가지로 operator로 제공되야 한다.
(p.operator*()).go(); 로 바뀌어서 호출될 것이다.
정리)
특정 객체가 임의의 포인터 타입이 되기 위해서는 아래의 두 연산자를 재정의 해야 한다.
*, ->
Smart pointer 특징)
진짜 포인터가 아니고 객체이므로 개발자가 생성/복사/대입/소멸의 과정을 직접 제어할 수 있다.
e.g, 소멸자를 활용한 자동 삭제
그리고 궁극적으로 Smart Pointer 로 활용되기 위해서는 어떤 object pointer 도 받아 들이기 위해서 template 을 이용해야 한다.
Smart pointer 의 복사 생성자
진짜 pointer 는 대입 연산자가 동작한다.
제대로 동작하지 않는다.
위 코드는 default 복사 생성자가 호출되어 얕은 복사가 진행됐기 때문에
소멸자에서 이미 해제된 메모리를 또 다시 해제하려고 할 것이다.
그렇다면, 얕은 복사 대신에 깊은 복사를 하는 복사 생성자를 만들면 해결이 될까?
하지만 Android Framework 에서는 객체 복사시에 깊은 복사 방식을 사용하지 않고
Reference counting(참조 계수) 방식으로 객체 복사를 구현하고 있다.
참조 계수 방식으로 Smart pointer 객체의 복사를 구현
왜 깊은 복사가 아닌 참조 계수 방식을 사용할까?
예를 들어, Smart pointer를 깊은 복사로 구현할 경우,
위 코드에서 p2에서 값을 수정할 경우 p1의 값이 변경되지 않는다
이것은 pointer 의 개념을 벗어나게 되고, 깊은 복사가 Smart pointer에 적용되지 않는 이유다.
이미 참조 계수 기반의 스마트 포인터는 C++ 표준에서 지원한다.
하지만 Android Framework 는 이 방식의 Reference counting 기법을 적용한 Smart Pointer 를 사용하지 않는다.
Reference counting 기법을 적용한 Smart pointer 의 문제점
Smart pointer가 처음에 의도했던(Pointer 같은 Object) 와 달리 sizeof 연산자를 사용하면
int* 와 다른 값을 나타낸다.
Reference counting 기법을 사용한 Smart pointer 는
참조 계수 기반으로 구현해야 하기 때문에, 포인터를 2개 가져가므로 8 byte 를 사용하게 된다.
그래서 Android Framework 에서는 표준에서 제공하는 Smart Pointer 를 사용하지 않는다.
해결책 :
reference count 을 Smart Pointer 에서 관리하지 않고 해당 object 에서 관리하도록 변경한다.
Reference count를 object 에서 관리하도록 변경
Smart Pointer 를 다시 되돌아 보면, Smart Pointer 의 장점은 객체의 생성/복사/대입/소멸을 직접 관리할 수 있다는 것이다.
그러므로, Smart Pointer 의 생성/소멸 시점에서 내부 객체(e.g, Car)의 참조 계수를 증가/감소 시키면 될 것이다.
더불어 Smart Pointer 는 내부 객체의 포인터만을 관리하게 됨으로써 궁극적으로 Pointer 그 자체로써 표현이 가능하게 된다.
결과적으로 개발자가 객체를 관리하는 것이 아니라, Smart Pointer 가 책임을 지게 되고
이렇게 위임된 코드 스타일을 proxy pattern 이라 한다.
하지만 객체의 포인터를 사용할 때, 매번 참조 계수를 inc/dec 하는 것은 매우 번거롭다.
그렇다면 Smart Pointer 의 생성/소멸에서 내부 객체의 참조 계수 증가/감소를 호출하는 방식을 살펴보자.
Smart Pointer 의 생성자,소멸자에서 내부 객체의 참조 계수 증가/감소를 호출하여
직접적으로 참조 계수 증가/감소를 개발자가 호출하지 않도록 했다.
이 방식을 적용한 Smart pointer는 진짜 pointer와 동일한 크기를 갖게 된다.
하지만 Android Framework 는 primitive type을 smart pointer로 지원하지 않는다.
primitive 는 mCount 같은 참조 계수가 내부 없기 때문이다.
결국, Android Framework 는 RefBase의 class 만을 Smart Pointer 로 지원한다.
정리 :
C++ 표준에서의 참조 계수 기반의 Smart Pointer 는 shared_ptr 이다.
shared_ptr
장점 : 모든 타입에 대하여 처리 가능
단점 : 메모리의 사용량 증가(reference count 를 내부에서 관리하므로)
Android 에서의 참고 계수 기반의 Smart Pointer 는 sp(strong pointer) 이다.
장점 : 메모리 사용량에 있어 overhead가 없다.(reference counting을 내부에서 관리하지 않음)
단점 : RefBase 클래스의 자식이 아닌 경우, Smart pointer로 처리될 수 없다.
sp : Smart Pointer 가 아니라 Strong Pointer로 불린다.
wp : weak pointer
상호 참조 - Reference counting 기법을 사용한 Smart pointer의 문제점
p1, p2 는 서로를 참조하므로 reference count 가 감소되지 않아 소멸자가 호출되지 않는다.
이런 상호 참조 문제점을 해결하기 위해,
상호 참조하는 경우 reference count 를 증가시키지 않도록 하는 방법이 제안되었다.
이것이 weak pointer 이며 C++ 표준으로 지원한다.
Android 에서는 객체 복사를 위해 아래 3가지 방법을 지원한다.
1) sp(strong pointer) : reference counting(참조 계수) 기반
2) wp(weak pointer) : reference counting 을 하지 않는 pointer (C++ 표준)
3) uniquePtr : 복사 금지에 사용하는 pointer
위 코드는 default 복사 생성자가 호출되어 얕은 복사가 진행된다.
하지만 main 함수가 종료될 때, p1의 소멸자가 호출되면서 "kkk"에 대한 메모리가 해제되는데,
p2에서 다시 해제하려고 하기 때문에 에러가 발생한다.
객체를 복사하는 기법
1) 깊은 복사(Deep copy)
Person class에서 복사 생성자를 정의하여 깊은 복사를 하도록 했다.
하지만 대부분의 open source에서는 이와 같은 깊은 복사를 진행하지 않는다.
복사 생성자 호출 시 내부적으로 메모리 동적 할당을 시도하기 때문에 비용이 높고 성능에 영향을 미친다.
객체를 복사하는 기법
2) 소유권 이전
소유권 이전 방식은 언제 필요한가?
e.g, swap
일반적으로 swap 은 source, target, temp 3개의 객체가 서로 복사되는 overhead가 발생한다.
그래서 얕은 복사로 진행하여 성능을 향상 시킬 수 있다.
소유권 이전 방식은 C++에서 표준으로 채택하였으며,
C++11 에서는 move 생성자를 지원하기도 한다.
하지만 소유권 이전 방식은 성능에 약간의 향상을 얻을 수 있지만 Android 는 이 방식을 사용하지 않는다.
객체를 복사하는 기법
3) Reference counting(참조 계수)
참조 계수 방식은 기본적으로 얕은 복사를 진행하나,
Reference counting 을 증가/감소시킴으로써
실제 참조하는 object 가 없을 때, 소멸되도록 하는 방식이다.
객체를 복사하는 기법
4) 복사 금지
참조 계수를 이용하는 것 조차 성능상에 문제가 발생할 수 있는 경우는,
복사 생성자와 대입연산자를 private 영역에 선언함으로써
아예 복사 자체를 금지하게 하는 방법도 있다.
Android Framework에서는 SP(Strong Pointer), WP(Weak Pointer) 는 참조계수 방식으로
UniquePtr 은 복사금지 방법으로 제공한다.
Singleton pattern
: 오직 유일한 하나의 객체만을 만드는 design pattern
Singleton pattern 구현 방법
1) 객체의 생성을 막기 위하여 생성자를 private 영역에 정의한다.
2) 생성된 객체 없이도 함수를 호출할 수 있기 위해서 정적 함수를 제공한다.
3) 객체의 복사와 대입을 금지하기 위하여 복사 생성자와 대입 연산자 함수를 private 영역에 정의한다.
하지만 Cursor class 내의 함수에서 일어나는 복사, 대입연산자로 인해
singleton 개념이 침해되는 것을 막을 수 없다.
따라서 객체 내부에서 일어나는 복사, 대입 연산자를 막기 위해서 함수를 선언만 한다.
하지만 함수의 정의를 하지 않고, private 영역에 선언만 해버리면, 컴파일 타임에는 문제가 없지만 링킹 타임에 에러가 발생한다.
또한 실제 개발할 때는 header와 source 코드가 나뉘기 때문에
header 파일에 위 처럼 선언 부분만 되어 있다면
이 객체를 사용하는 개발자는 이것이 선언만 되어 있는지 정의도 되어 있는지 알 수 없다.(실제 source code를 살펴보지 않는한..)
그래서 C++11 에서 제공하는 delete 키워드를 사용한다.
하지만 구현 할 때마다 singleton pattern을 매번 구현하는 것이 번거롭기 때문에
metacode 와 template 을 이용해서 좀 더 간단하게 singleton 을 구현한다.
1) 복사, 대입연산자를 매크로로 선언한다.(MAKE_NO_COPY)
2) 생성자, static 변수, 복사, 대입 연산자를 하나의 DECLARE 패턴으로 사용한다.
3) 구현 코드도 매크로로 치환한다.
구현 코드를 객체 내부에서 밖으로 가지고 나와서
생각해보면 매크로로 만드는데 조금더 쉽게 생각할 수 있다.
최종적으로 정리된 매크로로 구현한 Singleton pattern
Singleton 을 사용할 때 발생하는 concurrency 문제를 살펴보자.
일반적으로 multi thread 프로그래밍을 구현할 때,
critical section 의 자원을 동기화하기 위해 mutex 를 사용한다.
하지만 new Cursor에서 메모리 할당이 실패하면, exception 이 발생하게 된다.
예외가 발생한 시점 부터 이전으로 stack unwinding 한다.
이 상황에서 mutex.lock()이 걸려 있는 상태가 유지되어 deadlock 이 발생하게 된다.
이 문제를 해결하기 위한 RAII(Resource Acquisition Is Initialisation) 기법을 사용한다.
RAII 기법의 기본적인 원리는
C++은 지역 객체가 사라질 경우 소멸자가 불려지는 것을 보장하고,
혹은 heap 에 할당된 객체를 delete 할 경우 소멸자가 호출되는 점을 이용한다.
이렇게 block 내에서 lock 을 해제해주는 테크닉을 auto lock 혹은 scope lock 이라 한다.
C++11 에서는 위와 같은 auto lock 기법을 lock_guard class로 지원한다.
const function
: 멤버 함수 내부에서 사용되는 멤버 변수를 상수화하는 함수로 멤버 변수의 값을 변경할 수 없다.
const 키워드를 함수에 사용하게 되면, 함수의 signature 가 변경된다.
const 사용전에는 void display(); 의 signature는 void Point::display(Point* const this); 가 될 것이다.
this 자체의 주소는 변경할 수 없지만, this 포인터로 접근하여 변경할 수 있다.
const 를 사용하면, void Point::display(const Point* const this);로 signature가 변경되기 때문에
this->x 로 접근하여 변경이 불가능하게 된다.
display() 는 멤버 변수를 변경하기 위한 것이 아니라, 단순하게 출력이 목적이다.
멤버 변수 x의 값을 변경하는 동작은 display 함수 목적에 맞지 않다. bug가 된다.
이렇게 함수의 목적과 다르게 멤버 변수를 수정하지 않도록 보장하기 위해서 const function 을 사용하게 된다.
또한 상수 함수는 signature 가 다르기 때문에 overloading 이 가능하다.
상수 함수의 사용 목적 :
객체의 상태 값을 변경하지 않게 하기 위해서, 객체의 안정성을 높인다.
하지만, 그 본질은 안정성 때문이 아니다. 안정성은 장점이지 본질이 아니다.
또한 함수의 인자로 전달되는 원본 객체에 대한 수정을 방지하기 위해 const 와 & 를 사용한다.
display 가 const 가 아닐 경우, foo 함수 내에서 p의 객체 내부를 변경할 수 있게 된다.
상수 객체로 들어온 인자는 상수 함수밖에 호출이 안되기 때문에, const 를 사용하는 것이다.
(안정성 때문에 사용하는 것이 아니라..)
const 를 사용하는 것은 optional 이 아니라 requirement 이다.
상수 객체로 들어온 인자는 상수 함수 밖에 호출이 안되기 때문이다.
void display() const 를 주석 처리하면,
main 함수에서 foo(p); 코드가 실행이 안되는 이유가 바로
상수 객체로 들어온 인자는 상수 함수 밖에 호출이 안되기 때문이다.
상수 함수와 멤버 함수가 overloading 되었을 때, 누가 호출되는가?
1) 일반 객체에서는
일반 멤버 함수가 먼저 호출되고, 이것이 없을 대 상수 함수가 호출된다.
2) 상수 객체에서는
당연히 상수 함수만이 호출될 수 있기 때문에, 일반 멤버 함수는 호출되지 못한다.
util function 으로 to_string() 을 지원하는 class 를 작성했다.
하지만 sprintf 가 매번 호출되는 것이 성능 저하의 원인이라 가정하고, cached 개념을 적용해보자.
to_string()함수는 객체 내부의 x, y의 상태를 변경하는 함수가 아니다.
하지만 const 함수로 변경한다면, 아래 cache_valid, sprintf 코드에서 에러가 발생한다.
그렇다면 const내에서 사용되는 멤버 변수 중에서 상수화를 보장할 필요 없는 것은 mutable 키워드를 사용하면 어떨까?
하지만 mutable 를 사용한다는 것은, 클래스의 설계가 잘못되었다고 볼 수 있다.
mutable 을 사용하길 원하지 않는다면, mutable 대신에 변수를 구조체로 변경하고
그 구조체를 가리키는 포인터를 선언하여, 그 포인터로 const 함수에서 변경하도록 할 수 있다.
하지만 Cache 객체를 동적할당하기 때문에 그에 따른 단점도 발생할 수 있다.
Summary
1. 상수 함수는 멤버 변수의 포인터나 또는 참조를 리턴할 수 없으며, 값의 수정도 불가능하다.
2. 상수 함수 내에서 상수 함수가 아닌 함수를 호출하는 것은 불가능하다.
3. 상수 함수 내에서 멤버 변수의 포인터나 또는 참조를 리턴하고 싶은 경우,
혹은 값을 수정하고 싶은 경우에는 mutable 키워드를 사용한다.
혹은 변수를 구조체로 변경하여 해당 구조체의 포인터를 사용한다.
4. 변하는 것(정책)과 변하지 않는 것(알고리즘)을 분리하는 개념을 적용해도 된다.
5. 일반 함수와 상수 함수가 오버로딩된 경우 호출 순서
일반 객체 : 일반 함수를 먼저 호출하고, 일반 함수가 없을 경우, 상수 함수 호출
상수 객체 : 상수 함수만 호출 가능하다.
6. 상수 함수는 선택이 아니라 필수이다.
상수 객체는 상수 함수만을 호출할 수 있기 때문이다.
매크로 함수는 함수의 호출처럼 보이지만 전처리계 과정에서 치환되는 것일 뿐이다.
매크로 함수의 단점으로 단항연산자(++) 을 정상적으로 처리하지 못한다.
인라인 함수는 디버깅 모드나 컴파일러 최적화 옵션을 설정해주지 않으면 동작하지 않는 단점이 있다.
인라인 함수가 동작하지 않는 조건(컴파일러가 인라인 함수를 무시하는 경우)
1) 재귀 호출
2) 함수 포인터 사용 시
3) 함수의 기계어 코드 크기가 매우 큰 경우, 컴파일러가 inline으로 실행하지 않음
전통적으로 C언어 개발자들은 함수 호출에 따른 오버헤드를 줄이기 위해서 매크로를 사용한다.
의 결과는 어떻게 될까?
9라고 예상하기 쉽지만, 12 혹은 16 으로 출력된다.
처럼 3이 전달되고 3 * 3 연산이 진행될 것으로 예상할 수 있으나,
으로 치환된다.
결과적으로 매크로 함수는 위와 같은 단항연산자의 문제를 해결할 수 없다는 문제점이 있다.
C++ 에서는 매크로 함수를 전처리기가 실행하는 것이 아니라, 컴파일러가 실행하도록 변경하였다.
inline 함수가 이렇게 동작한다.
위 코드는 add 함수와 달리 함수의 기계어 코드가 남게 된다.
add 함수는 asm 코드를 확인해보면 call add 를 호출하게 되는데,
inline_add 는 inline 함수이므로 컴파일러가 해당 line 을 기계어 코드로 변경하게 된다.
한 가지 주의할 점은, inline 함수를 사용하려면 컴파일 최적화 옵션을 주어야 한다.
Visual studio 개발 환경에서는 아래와 같이 cl 호출 시 옵션을 /Ob1 을 줘야 한다.
C:\ cl inline_function.cpp /FAs /Ob1
혹은 visual studio 에서는 project > 속성 > c/c++ > 최적화 에서 설정할 수 있다.
결론적으로,
인라인 함수는 함수의 호출 자리에 기계어 코드로 치환되는 함수를 의미한다.
장점 : 인라인 함수는 전처리기가 아닌 컴파일에 의해 처리되므로 매크로의 효율성은 그대로 유지하면서 코드의 안전성은 높아지게 된다.
단점 : 자칫 목적 파일의 크기가 커질 수 있으므로, 함수의 구조가 간단한 경우에만 사용하는 것을 권장한다.
하지만 inline 함수가 적용되지 않는 한 가지 경우가 있다.
재귀 함수의 경우 inline 함수가 적용되지 않는다.
또 한 가지 inline 함수가 적용되지 않는 예를 살펴보자.
foo(), goo() 함수 호출 시 아래와 같은 기계어 코드로 변경된다.
call 로 호출이 되냐 안되냐에 차이가 있는데
inline function 은 call 명령어를 사용하지 않는다.
(call 명령어는 instruction pointer에 있는 내용을 stack 에 넣고(push) 해당 주소로 jump 한다.)
하지만 function pointer의 경우 runtime 에 언제든지 변경될 수 있으므로,
컴파일러가 이것이 inline function 을 가리킬지 일반 함수를 가리킬지 확신할 수 없다.
따라서 function pointer 의 경우 inline function 을 가리키게 해도 inline 으로 치환되지 않는다.
Summary
1. 인라인 함수는 함수 호출 명령이 함수 코드로 확장되는 함수
2. 일반적으로 컴파일러는 인라인 명령을 수행하지 않으며 최적화 옵션을 통해 실행될 수 있다.
3. 함수 호출로 인한 성능 저하가 없으며 매크로 함수보다 안전하다.
4. 목적 파일의 크기가 커질 수 있으므로 가급적 짧은 함수에 사용하는 것이 좋으며
목적 파일의 크기가 오히려 작아질 수 있다.
5. 경우에 따라서 컴파일러가 인라인 명령을 무시할 수도 있다.
e.g, 크기가 매우 큰 함수, 재귀 호출, 함수 포인터 사용 등
임시 객체는 개발자가 의도해서 생성할 수도 있지만 대부분 컴파일러의 필요에 의해서 생성된다.
primitive 말고 객체를 임시 객체로 생성되는 경우 성능에 영향을 미칠 수 있다.
그러므로 함수 안에서 객체를 지역 변수로 단순히 생성해서 반환하는 경우 임시 객체를 반환하도록 해서
임시 객체가 컴파일러에 의해 생성되지 않도록 최적화해야 한다.
먼저 main 함수에서 Int32(10); 코드는 임시 객체를 생성한다.
이 코드에서 임시객체는 main 함수가 끝나지 않았는데도, 해당 line 에서 생성되고 line 이후에는 바로 소멸된다.
cc = aa + bb; 코드에서는 aa.operator + (bb) 를 통해 임시 객체가 생성되고
이 임시객체의 복사생성자에 의해 cc 로 결과가 대입된다.
primitive type 의 경우에도 마찬가지이다.
z = a + b; 코드에서 a + b 는 임시 객체가 생성된다.
결국엔 대입 연산자 때문에 임시 객체가 생성되는데,
10 + 20 의 결과 30이 메모리상에 먼저 저장되고 이후 z에 저장된다.
premitive type 에는 임시 객체 생성/소멸이 큰 부담이 되지 않지만
user defined class 의 임시 객체 생성과 소멸은 다른 얘기가 된다.
따라서 위 예제에서는 + 연산자를 재정의한 코드를 수정함으로 써
임시객체를 바로 반환하도록 할 수 있다.
지역 변수를 생성해서 반환하는 것이 아니라, 임시 객체를 명시적으로 반환한다.
이렇게 하면 아래 cc = aa + bb 에서 임시 객체가 추가로 생성되지 않는다.
이렇게 임시 객체를 바로 반환하는 기법을 RVO(Return Value Optimization) 이라 한다.
마지막으로 임시 객체와 참조에 대해 생각해보자.
값이 아닌 참조를 전달할 경우에는 임시 객체가 생성되지 않는다.
따라서 임시 객체 생성으로 인한 성능 저하를 막기 위해서 아래 2가지 방법이 사용될 수 있다.
1. RVO
2. Return of Reference
우리는 함수의 포인터를 사용하여 함수를 또 다른 함수의 인자로 또는 반환 타입으로 사용할 수 있다.
포인터 변수 선언 방법은 어떻게 하는가?
타입 * 변수명; (통상 C++은 type에 *를 붙여쓰고, C개발자는 변수명에 붙여씀)
함수 포인터 선언시 필요한 '함수의 타입'은 무엇인가?
예를 들어, int foo() 란 함수를 가리키는
함수 포인터의 타입은 int를 return 하고 parameter 가 없는 것이다.
함수 포인터 변수 선언은 리턴타입(*변수명)([매개변수]); 으로 작성한다.
함수 호출 시, 함수 호출 연산자(()) 를 사용해야 함을 유의하자.
static function 또한 함수 포인터로 할당할 수 있다.
다만 static_function 은 this 개념이 없지만,
C언어의 전역 변수와 동일한 개념이고, Clazz 라는 namespace에 종속되어 있는 것이 차이가 있을 뿐이다.
따라서 Clazz namespace 를 통한 참조로 접근할 수 있다.
멤버 함수를 함수 포인터로 할당하는 경우를 주의해야 한다.
명시적으로 & 를 붙여줘서 해당 객체에 접근하도록 한다.
하지만 mfp() 호출은 불가능 하다. this 를 참조할 수가 없기 때문인데,
객체의 주소는 레지스터에 저장되어 있기 때문에, 명시적으로 넘겨줄 수 없다.
이런 경우 .* 연산자가 필요하다.(조금 생소하지만 C++ 창시자가 이렇게 만들었다..)
.* 좌측에는 객체가 와야 한다.
하지만 만약 좌측에 온 객체가 포인터라면 ->* 연산자를 사용한다.
->* 연산자는 하나로 봐야하고, 좌측의 객체는 포인터여야 한다.
정리하자면, 일반 멤버 함수는 C언어의 함수포인터로 저장될 수 없다.
함수 포인터에 this 개념이 없기 때문이다.
하지만 정적 멤버 함수의 경우, 일반 함수 포인터에 대입될 수 있다.
따라서 p.set(0, 0); 을 호출하면, set(&p, 0, 0); 으로 변경되서
memory 의 text 영역에 객체 p의 stack 주소를 알 수 있게 한다.
모두가 잘 아는 얘기지만
memory 는 heap, stack, data, text 영역으로 나뉘고
Point class 의 set function 은 text 영역으로 할당된다.
그리고 Point의 x, y 멤버 변수는 stack 영역에 할당된다.
static 변수와 this 의 관계를 살펴보자.
정적 멤버 함수는 왜 멤버 변수를 참조할 수 없는 것일까?
정적 멤버 함수는 Clazz 의 namespace 에 속해있는 전역 함수이다.
하지만 Clazz 의 namespace 에 속해 있다고 해서 this 키워드를 사용할 수 있는 것은 아니다.
정적 멤버 함수는 this 가 없어 this 키워드를 사용할 수 없다.
static_value 는 전역 변수이므로 this 없이 접근이 가능하다.
this->member_value = 0;으로 바뀌는데 this 로 참조할 수 없으니 에러가 난다.
반면 멤버 함수는 당연하게도 this 를 참조할 수 있어 멤버 변수, 정적 변수에 모두 접근할 수 있다.
대부분의 해외 개발자들은 변환 연산자보다는 변환 인터페이스 사용을 권장하고 있다.
Android에서는 인터페이스와 바인더 사이의 변환을 하기 위해서 아래의 두 함수를 제공한다.
asBinder, asInterface
foo(c); 코드는 개발자의 의도와 달리, 컴파일, 런타임에 에러 없이 동작하고 있다.
Complex의 int() 연산자 재정의를 함으로써 암시적으로 형변환이 되어 에러가 발생하지 않는다.
예를 들어, 다음 코드는
아래와 같은 단계로 형변환이 되어 동작한다.
int real = c;
int real = int(c);
c.operator int();
하지만 많은 대가 들이 operator 를 이용해서 형변환하지 말것을 강조하고 있다.
위의 형변환 문제는 Android framework에서도 동일하게 나타난다.
Framework에서 service 를 개발할 때, IBinder와 IInterface를 둘 다 상속(다중상속)을 받는데,
IInterface 와 IBinder 간에 형변환이 가능해야 하는 구조를 가지고 있다.
그래서 Android에서는 IInterface 에는 asInterface 를 제공하고, IBinder에는 asBinder를 제공하여
서로의 형변환 처럼 동작하도록 제공한다.
1. static_cast : 이성적인 형 변환을 지원하는 연산자
포인터를 사용하여 변환을 수행할 경우, 일단 static_cast 를 먼저 사용하는 것이 바람직하다.
위 코드가 c로 컴파일 하면 error 발생하지 않고
cpp로 컴파일하면 error가 발생하는 이유는 무엇일까?
malloc() 함수로 반환되는 void* type 을 char*로 casting 하는 것은 사실 C언어에서도 허용되선 안되는 코드이다.
C언어 컴파일러는 개발자의 코드를 100%신뢰하는 것을 전제로 개발되었기에 컴파일 타임 에러를 발생시키진 않는다.
하지만 C++ 는 형변환을 strict 하게 처리한다.
그러므로 개발자가 명시적 형변환을 해야 한다.
하지만, 명시적 형변환은 컴파일러가 무조건 허락해주는데 문제점이 있다.
그러므로, static casting 을 사용해서 위의 문제점을 예방한다.
static_cast 는 이성적인 형 변환만을 진행한다.
malloc 으로 반환되는 void* 는 그 자체로 연산이 불가능하므로,
char* 로의 형 변환은 이성적이라 말할 수 있다.
2. reinterpret_cast : 비이성적인 형변환을 하려는 경우 사용한다.
C언어의 대부분의 형 변환을 지원한다. (마치 C언어의 명시적 형변환 같이 동작한다.)
double 값을 int*로 casting 하듯 down casting이 필요한 경우가 발생한다.
예를 들어, big endian 과 little endian 을 검사하는 경우
c 를 출력할 때 1이 출력되면 little endian으로 볼 수 있다.
하지만 컴파일러는 이성적인 형 변환이 아니기 때문에 에러를 반환한다.
위와 같이 비이성적인 형 변환을 위해서는 reinterpret_cast 를 사용해야 한다.
3. const_cast : 상수 객체를 비상수 객체로 변환할때 사용한다.
const_cast 를 사용했다는 것은 대부분 설계가 잘못되었을 가능성이 높다.
4. dynamic_cast : 안전하게 pointer 와 reference 를 상속관계에 있는 class로 up, down, side casting 을 지원한다.
Lambda
: scope 내에 있는 변수에 접근하여 사용할 수 있는 이름없는 함수 객체(Closure)를 생성하는 방법
먼저 함수 객체가 어떤 개념을 갖는지 살펴보자.
p는 객체인데, 마치 function 처럼 쓰이고 있다.
원리는 p.operator()(1, 2) 를 호출하는 것이다.
괄호()도 재정의가 가능하다!
함수 객체 개념
: () 연산자를 재정의 해서 함수 처럼 사용 가능한 객체(Function operator, Functor)
함수 객체를 왜 사용하는 것일까?
cmp1, cmp2 는 함수 이름은 다르지만 signature 가 같기 때문에
함수 포인터 f1으로 가리킬 수 있다.
하지만 signature 가 같기 때문에 cmp1, cmp2 는 같은 type이라고 할 수 있다.
반면, Less, Greater 의 () 는 모두 같은 signature 를 같지만
Less() 는 Less 만의 typedㅣ고, Greater() 는 Greater 만에 종속된 type 이다.
핵심 1. 일반 함수는 자신만의 타입이 없다.
signature가 동일한 함수는 모두 같은 타입니다.
핵심 2. 함수 객체는 자신만의 타입이 있다.
signature 가 동일해도 모든 함수 객체는 다른 타입이 된다.
inline 사용이 필요한 경우를 살펴보자.
먼저 Sort() 함수를 살펴보자.
우리는 정렬 함수를 구현할 때 비교 함수를 함수 포인터로 받아 상황에 따라 동적으로 바꿀 수 있다.
하지만, 아무리 비교 함수(e.g, cmp1, cmp2) 가 inline 으로 선언되었다 해도
실제로 컴파일을 할 때 inline 치환이 되지 않는다.
cmp 로 올 수 있는 것은 무궁무진하기 때문에 컴파일러 입장에서는 inline 으로 치환 할 수 가 없다.
Sort에 인자로 오는 *cmp 함수 포인터는 절대로 inline 치환 될 수 없다.
결국 inline 을 사용하여 성능 향상을 가져올 수 없다.
반면에, 함수 객체를 사용한 Sort2 함수를 보면
컴파일 입장에서 Sort2에 전달되는 less 는 Less type으로 정확히 알 수 있고,
Less 내부에 () 는 inline 으로 되어 있으므로, inline 으로 치환되어 성능향상을 가져올 수 있다.
하지만 Sort2 는 정책을 바꿀 수 없으므로, Greater type을 받아들일 수 없다.
결국 Template 을 사용하면 정책도 바꿀 수 있도록 해야 한다.
Sort3의 T 는 template 이기 때문에, 전달되는 T type 에 따라서 목적 코드가 커지는 단점이 있다.
하지만 이 Sort3() 함수가 아주 큰 function 은 아니고, 전달되는 T type의 개수가 실제 코드에 아주 많지 않다면 큰 문제가 되지 않는다.
실제로 함수 포인터와 함수 객체를 사용했을 때는 비교하면 꽤나 큰 성능 향상을 가져온다.
간단한 예제 프로그램에서만도 10배 정도의 차이를 나타낸다.
그래서 C++11에서는 이 함수 객체를 더 편하게 사용하기 위해 lambda 를 도입한다.
먼저 () 연산자를 재정의할 때 주의할 점이 있는데,
대부분 함수객체의 () 연산자 함수는 상수 함수로 만드는 것이 좋다.
위 예제의 foo() 함수에서 처럼 상수 객체에서 호출하는 경우가 있기 때문인데,
일반적으로 template 함수 작성시 T type을 인자로 받을 때 값 복사가 이뤄지는 redundant 한 상황을
방지하기 위해 관습적으로 const T& 로 선언하게 된다.
위 예제를 보면 결국 const T& a 가 되는데, a는 상수 객체가 된다.
상수 객체는 상수 함수만을 호출할 수 있으므로 () 연산자 재정의시에 상수 함수로 만들어야 한다.
그럼 이제 Lambda 표현식을 어떻게 사용하는지 살펴보자!
람다 표현식(Lambda Expression)은 함수 객체를 만드는 표현식이다.
[] 는 Lambda Introducer 라고 하며, Lambda가 시작됨을 알리는 표현식이다.
위 sort() 코드는 컴파일러가 아래와 같이 함수 객체를 생성하는 코드로 변경하게 된다.
Closure(클로져)는 람다 표현식을 통해서 컴파일러가 만든 클래스이다.
결국 Lambda 를 사용하는 이유?
함수객체를 사용해서 inline 치환을 하고 성능 향상을 얻기 위해서이다.
Lambda의 특징에 대해 살펴보자.
f1, f2 는 구현이 완전히 똑같은 객체다.
하지만 람다는 함수를 만드는게 아니라 함수 객체를 만드는 것으로
결국 f1, f2 는 다른 타입이 된다.
실제로 f1, f2 의 이름이 다른 것을 RTTI 기법을 사용하여 확인할 수 있다.
결론 : 모든 람다는 다른 타입이다.(함수 객체 이므로..)
위 예제에서와 같이 다시 f1에 함수 객체를 넣으려고 하면,
실제 구현 코드는 똑같아도 위와 다른 타입이기 때문에
f1에 다른 타입을 넣을 수 없어서 컴파일 에러가 난다.
앞으로 f1은 다른 타입을 가리킬 수 없게 된다. 그러므로 inline 치환된다.
Labmda 는 함수 포인터로의 변환도 가능하다.
하지만 f2 는 함수 포인터 변수 이므로, 상수가 아니다.
이후 code에서 다른 함수를 가리킬 수 있으므로,
그러므로 inline 치환되지 않는다.
f3도 다른 function 을 참조할 수 있다. e.g, f3 = &foo;
결국엔 inline 치환되는 것은 오직 f1하나뿐이다.
inline 치환되기 위해서는 컴파일러가 해당 타입이 변경되지 않을 것임을 명확하게 인지되어야 한다.
따라서 아무리 Labmda 표현식을 사용하더라도 그것을 담을 변수가 변경되지 않는 속성을 가져야 한다.
Lambda 에 전달될 수 있는 인자로는 무엇이 좋을지 다시 정리해서 생각해보자.
1. 함수 포인터
- 가능하긴 하지만 함수 포인터는 inline 치환이 되지 않으므로, lambda 를 사용하는 의미가 없어진다.
2. function template class
- 가능하지만 function<> 으로 전달되는 것은 변수이므로 inline 치환되지 않는다.
3. auto
- auto 는 절대 함수 인자로 받을 수 없다.
4. template
- OK!! inline 치환이 된다.
결국, 람다 표현식을 인자로 받으려면 template 을 사용하자!
Lambda에서 return type은 어떻게 표시해야 할까?
f1의 경우 return type이 int 하나로 결정되어 있는 경우, 컴파일러가 자동으로 추론한다.
하지만, f2처럼 -> 를 사용해서 람다의 리턴 타입을 명확하게 표시할 수 도 있다.
f3처럼 if-else 문이 있더라도 반환하는 타입이 동일하기 때문에, 컴파일러가 리턴 타입을 자동으로 추론할 수 있다.
하지만 f4와 같이 2개 이상의 리턴문이 다른 타입을 반환하면
반드시 trailing return 을 표시해야 한다.
Lambda 내부에서 Lambda외부에 선언된 변수에 접근(Capture)하기 위한 방법은 무엇일까?
Lambda 외부에 선언된 변수에 접근하고자 할 때는 [] 안에 해당 변수이름을 전달한다.
또한 해당 block 내의 모든 지역 변수에 접근하고자 할 때는 "="를 전달한다.
실제로 []에 변수 이름을 전달하거나 "="를 전달했을 때 생성되는 코드는 다음과 같다.
결국엔 Closure 객체 안에 멤버 변수로 보관하고 있는 것이다.
Closure에서 변수를 capture하고 있는 원리에 한 단계 더 접근해보자.
v1 = 0; 은 에러를 발생시킨다.
() 연산자를 재정의한 것이 상수 함수이므로, 멤버 변수를 변경할 수 없기 때문에 컴파일 에러가 발생한다.
그렇다면 Closure_Object 내에 멤버 변수에 mutable 선언하면 되지 않을까?
mutable 키워드를 사용하여 mutable lambda 로 선언한다.
지역변수를 캡쳐한 멤버 변수가 mutable 이 된다.
하지만 Closure_Object의 v1 멤버 변수(복사본)이 변경된 것이지
main 함수의 v1 지역변수(원본)이 변경된 것이 아니다.
main 함수의 지역변수(원본)을 변경하려면 mutable 키워드는 삭제하고, & 를 추가한다.
[]에 &를 전달했을 때 컴파일러가 생성하는 Closure 객체는 다음과 같다.
지역 변수가 아닌 class 의 멤버 변수에 접근하기 위해서는 어떻게 해야할까?
단순히 [] 에 data를 전달하면 되지 않을까 생각할 수 있지만,
data 는 지역변수가 아니기 때문에 [data]라고 쓸 수 없다.
Class내에서 내부 어디서든 접근 가능한 키워드를 생각해보면, this 가 있다!
[]에 this를 전달하면 &키워드가 없으므로, 값이 전달된다.
하지만 this 는 포인터이기 때문에 멤버변수 data의 변경이 가능하다.
결국엔 컴파일러에 의해 생성되는 Closure_Object 멤버 변수로 Test* 가 있는 것이다.
Deleted function
: function 을 사용하지 않고 지워버림을 명시적으로 나타내는 syntax.
Mutex class에서 복사생성자가 필요가 있을지 생각해보자.
개발자가 어떤 function 이나 operator 를 삭제하길 원한다면 delete 키워드를 사용하면 된다.
위 예제에서는 복사생성자가 동작하지 않길 원하기 때문에 복사생성자, 그리고 =(대입연산자)를 삭제했다.
그리고 반드시 private 에 쓸 필요는 없지만,
어차피 복사생성자를 안쓰려는게 목적이기 때문에 private 에 쓰는 것이 더 좋다.
delete 사용시 주의할 점은 삭제하려는 function 의 선언시에 사용되어야 한다는 점이다.
선언 이후에 삭제할 수는 없다.
또한 default 생성자를 명시적으로 나타내는 키워드로 default 를 사용할 수 있다.
물론 Mutex() {} 와 같이 사용할 수 있지만,
C++창시자는 Mutex() = default; 라고 쓰는게 더 직관적이지 않냐고 얘기한바 있다.
User define literal
: 사용자 정의 literal operator 를 추가할 수 있다.
예제를 통해서 살펴보자.
premitive type 인 float의 값을 표현할 때 접미사로 f 를 사용할 수 있다.
이와 같이 사용자 정의 class 인 Meter 에도 단위를 직관적으로 표현하도록 literal operator 를 정의할 수 있을까?
Meter classd에서 m operator 를 정의하여 user define literal operator 를 사용할 수 있다.
한 가지 주의할 점은 operator 를 정의할 때 전달 받는 인자의 타입이 정해져 있다는 것이다.
정수 literal 은 unsigned long long, const char* 로 받을 수 있으며,
부동소수점 literal 은 long double, const char* 로,
무자열 literal 은 (const char*, size_t) 로,
문자 literal 은 char 로 받을 수 있다.
하지만 사용상의 문제점은 다른 개발자가 3m 를 3 미터가 아니라 3분으로 인식할 수도 있다는 것이다.
그래서 C++ 표준 위원회에서는 왠만하면 사용자 정의 상수를 정의하지 말것을 recommend 하고 있다.
r1 = r2; 코드는 값이 복사되는 것일까? 참조하는 주소가 복사되는 것일까?
정답은, 값이 복사된다!!
Why?
C++에서 참조라는 개념은, 한번 초기화되면 다시는 다른 곳을 가리킬(참조) 수 없다.
const 와 동일한 느낌이다.
그러므로 r1 = r2; code 에서 r1이 가리키는 참조 주소가 변경되는 것이 아니라(변경될 수 없음),
r2가 참조하는 곳의 값이 r1이 참조하는 곳에 다시 쓰여지는 것이다.
참조와 포인터는 모두 기존 메모리를 가리키게 된다.
하지만 대입 연산시에 차이점이 있다.
참조(Reference) : 값이 이동한다. 값을 꺼낼 때 *를 붙일 필요가 없다. 참조는 자동으로 역참조가 되는 상수 포인터라고 볼 수 있다.
포인터(Pointer) : 참조(주소)가 이동한다. 값을 꺼낼 때 *를 붙여야 한다.
그렇다면 값이 아닌 참조가 이동할 수 있는 참조를 만들 수 있지 않을까?!
해결책 2) 이동 가능한 참조 만들기
C++의 참조는 기존 변수에 이름을 하나 만들어서 메모리 주소를 가리키는데 사용한다.
결국에는 객체 하나 만들어서 그 안에 포인터 두고 그 주소를 가리키게끔 하는 거랑 똑같다.
우리는 그것을 xreference_wrapper class로 만들었다.
그리고 참조는 다른 변수를 가리켜야 한다. 그러기 위해선 포인터가 필요하고..
그 포인터는 T* obj; 이다.
main() 함수에서 r1 = r2; 코드는 값이 아닌 참조가 이동한다.
우리는 xreference_wrapper 클래스에 대입연산자를 정의하지 않았지만,
default 대입 연산자가 동작할 것이고 이것은 포인터가 가리키는 주소를 변경하게 된다.
그렇다면, *(asterisk)없이 값에 접근할 수 있는 code만 추가되면 된다.
그것은 &연산자를 재정의함으로써 가능하다.
또한 &연산자를 재정의함으로써 int& r3 = r1; 코드에서
r1은 객체인데, c++에서 변환 연산자가 동작하므로 결국엔 int* 를 r3에 전달할 수 있게 된다.
Reference(참조)를 class 로 구현해서 값이 아닌 참조가 이동되도록 했다.
xreference_wrapper 를 이용해서 wrapFunc함수를 호출해보자.
위 예제에서
코드는 모두 n의 주소를 보낸다.
r은 은 xrefernce_wrapper 이므로 int& 으로 변환이 가능하다.
따라서 wrapFunc에 전달된 T 는 int& 가 된다.
하지만 &n 은 wrapFunc에 전달된 T가 int* 가 되므로 goo(int&)으로 호출이 불가능하다!!
여전히 문제점이 남아있다.
먼저 이전 예제에서 사용한 xreference_wrapper에 대해 생각해보자.
Class template(클래스 템플릿)은 T의 암시적 추론이 불가능해서 항상 어렵다.
그렇다면 암시적 추론이 가능한 Function template(함수 템플릿)을 사용해 좀 더 쉽게 만들어 보자!
xref 함수는 전달된 T& 를 이용해서 참조를 나타낼 수 있는 xreference_wrapper로 변환하여 반환하는 함수이다.
xreference_wrapper 로 반환될 경우 참조를 전달받는 함수에 전달이 가능하다!
r은 main 함수 내에 계속 쓸것인가? 아니다. wrapFunc에 잠깐 전달하기 위한 용도다.
그러므로 임시객체를 사용하는 것이 더 바람직하다.
하지만 xreference_wrapper 는 class template 이기 때문에, 생성자를 통해서 type을 추론할 수 없다.
그래서 를 항상 써야 한다.
하지만 function template(함수 템플릿)은 전달되는 인자로 type이 추론 가능하다!
결국엔 참조를 보내려면 이렇게 해야 한다.
Function template은 전달된 인자의 타입을 추론할 수 있어서
함수 내부에서 다시 Class template으로 전달할 때는 이미 추론한 type을 전달하기 때문에
Class template에 전달하는데 문제가 없게 된다.
참조를 전달할 수 있는 ref 를 사용하는 예제를 살펴보자.
먼저 C style의 코드부터 살펴보자.
f1 함수 포인터는 인자가 없고 반환도 하지 않는 함수를 가리킬 수 있다.
위 예제에서는 foo 함수를 가리키는데,
f1 함수 포인터는 signature 가 다른 함수를 가리킬 수 없다.
그럼 C++ 에서는 어떻게 할 수 있을까?
f 의 장점은 signature가 다른 goo 함수를 가리키게 할 수도 있다는 것이다.
하지만 goo 함수를 가리키도록 하여 goo함수를 호출하면,
n 의 값이 변경되지 않음을 알 수 있다.
perfect forwarding 이 되지 않았다는 의미이다.
결국엔 ref 를 이용하여 참조가 전달되도록 하면 n 이 변경되는 것을 확인 할 수 있다.
rvalue, lvalue에 대한 예제를 살펴보자.
foo(int&)에 전달된 c 는 const int 이므로 int& 로 전달받을 수 없다.
또한 goo(int)에 전달된 n 은 int& n으로 전달되었기에 error 가 발생한다.
그렇다면 functcion template 으로 바꾼 후에는 어떻게 될까?
foo(c); 을 호출하면 T가 const int 로 결정되므로 문제가 없다.
또한 goo(&n); 을 호출하면 T가 int* 가 되므로 문제가 없다.
이제 &가 하나가 아닌 좀 더 복잡한 경우를 살펴보자.
이전 포스트에서 &은 lvalue reference 이고, && 은 rvalue reference 라고 했었다.
foo(int&&) 함수는 rvalue reference 를 인자로 받는다.
따라서 foo(10) 은 동작하지만, n은 lvalue 이기 때문에 foo(n) 호출 시 문제가 된다.
goo(T&&)함수를 살펴보자.
goo(r) 을 호출할 때 T는 어떻게 될까?
r은 int& 타입인데, 결국에 goo 에 전달된 a 는 int& && 타입을 갖는 것일까?
이렇게 &가 3개 이상 충돌할 경우에는 어떤 reference 타입이 되는지 규칙이 있다.
& && 만날 경우 & 가 되고
&& & 경우 & 가 되며,
&& && 는 && 가 된다.
결국 && && 두개가 만나야 && 가 된다.
이 규칙에 따라서 goo(r)를 호출하면 결국 a 는 int&& 타입이 된다.
정리하자면,
int& : lvalue reference 는 lvalue 타입만 받는다.
int&& : rvalue reference 는 rvalue 타입만 받는다.
T&& : universal reference(forward reference) 라고 부른다.
이 Universal reference 는 lvalue 가 전달되면 lvalue reference 가 되고
(T : int& 되므로, T&& int& && 가 되고 => int &)
rvalue 가 전달되면 rvalue reference 가 된다.
(T : int&& 되므로, T&& 는 int&& && -> int&&)
지금까지 얘기하는 이 모든게 perfect forwarding 을 위해서이다.
타입의 종류와 인자 개수에 제한받지 않고 인자를 전달받기 위해서 template 과 universal reference 를 쓰는 것이다.
그렇다면 universal reference 를 사용하는 간단한 예제를 살펴보자.
wrapFunc(foo, 10); 을 호출하면 10은 rvalue 이므로,
T&& 는 int&& 가 되어 rvalue 를 전달받을 수 있게 되고 foo(int) 함수를 호출하는데 문제가 없다.
또한 wrapFunc(goo, n); 을 호출하면 n 은 lvalue 이므로,
T&& 는 int&가 되어 lvalue 를 전달받을 수 있게 되어 goo(int&) 함수를 호출할 수 있다.
위 예제에서 문제점은 무엇일까?
wrapFunc(foo, 10)을 호출하면 10은 rvalue 이기 때문에 T&& 는 int&& 로 전달된다.
하지만 a는 lvalue 이기 때문에! foo(int&&) 에 전달할 수 없다.
a가 lvalue 인 것이 이해하기 어렵다면 아래 코드를 살펴보자.
위 코드에서 r 은 rvalue 인가? lvalue 인가?
10은 rvalue 이지만 r 은 lvalue 이다.
이전 예제에서도 동일하게 wrapFunc(F f, int&& a) 에서 a는 lvalue 가 되는 것이다.
그리고 이 lvalue 인 a를 foo(int&&)에 전달하니 error가 발생하는 것이다.
그렇다면 casting 을 해서 rvalue 일 때는 rvalue 로, lvalue 라면 lvalue로 전달해주면 되지 않을까?
static_cast<T&&> 는 인자가 rvalue 라면 rvalue 로, lvalue 라면 lvalue로 캐스팅해준다.
rvalue가 오면 static_cast(a);
lvalue 가 오면 static_cast(a); 가 된다.
하지만 좀 더 직관적으로 표현할 수는 없을까?
캐스팅이 아닌 함수를 호출하는 것으로 대신할 수는 없을까?
캐스팅하는 코드를 xforward란 함수를 만들어 감추고 단순 함수 호출로 사용해보자.
하지만 이 코드에는 문제가 있다.
wrapFunc(F f, T&& a)에서 a로 10을 전달하면,
T&& 는 int&&가 되고 a는 lvalue 가 된다.
따라서 xforward의 T&& 는 int& 로 추론된다.
컴파일러가 타입을 암시적으로 추론해버리는 것이다.
결국엔 반드시 컴파일러가 명시적으로 추론하도록 해야 한다.
위 예제에서 만든 xforward는 이미 C++ 표준에서 forward 함수로 제공하고 있다.
그렇다면 이제 타입에 관해서는 해결을 했으니, 여러 개의 인자를 받고 반환해주는 일이 남았다.
일단 여러개의 인자를 전달 받기 위해서는 '...' 를 인자에 붙여준다.
또한 forward 에 전달할 때도 ... 를 붙여주는데 (args) 밖에 써야한다는 점에 주의하자.
return type을 알 수 없으므로, auto 키워드를 사용하여 반환한다.
완벽한 전달자가 되려면,
1. 인자를 Universal(forward) reference 사용
2. 원래 함수를 보낼 때 인자를 다시 forward로 묶어서 전달
3. forward 방식의 명시적 추론을 사용
4. 여러개의 인자를 받기 위해 가변인자 템플릿을 사용
하지만 아직까지도 문제점이 남아 있는데...
반환 타입이 참조일 경우 문제가 생긴다.
만약 int& foo(int a); 라면 어떻게 될까?
그전에 잠시 ... 가 밖에 써야하는 점에 대해 간단한 예제를 통해 살펴보자.
goo(args...);를 호출하면 goo(1, 2, 3); 이 될 것이다.
hoo(args...); 를 호출하면 어떻게 될까?
에러가 발생한다. hoo 함수는 인자가 1개이기 때문이다.
goo(hoo(args)...); 를 호출하면
goo(hoo(args의 1번째), hoo(args의 2번째), hoo(args의 3번째)); 와 같다.
이전 예제에서 ... 를 밖에 써야 하는 이유에 대해 조금은 이해가 됐으리라고 생각한다.
마지막으로 Perfect forwarding 이 적용된 예제를 살펴보자.
Android 에서 singleton 을 구현할 때 사용하는 CRTP 기법에 perfect forwarding 을 적용해보자.
CRTP 기법은 부모가 템플릿인데 자식이 상속 받으면서 자신의 이름을 부모에 템플릿 인자로 전달하는 기법이다.
하지만 반드시 default constructor가 필요하다는 단점이 있다.
perfect forwarding 을 사용하여 이 단점을 해결할 수 있다.