本章主要记录一下C/C++基础方面的一些内容,以备后续查验。

1. 运算符重载

在C++中为了使用方便,可以对运算符进行重载,可重载的运算符有:

+       −       ∗        /        %          ˆ          &
|       ˜       !        =        <          >          +=
−=      ∗=      /=       %=       ˆ=         &=         |=
<<      >>      >>=      <<=      ==         !=         <=
>=      &&      ||       ++       −−         −>∗        ,
−>      []      ()       new      new[]      delete     delete[]

如下运算符并不能被重载:

  • ::: 域限定符(scope resolution)

  • .: 成员选择(member select)

  • .*: 访问指针成员变量

这些操作符所接受的第二个参数通常是一个名称(name),而不是一个值(value),来访问对应的成员。假若允许这些操作符进行重载的话,可能会导致一些微妙的问题的出现。

此外?:运算符也一般不能够进行重载。

1.1 单目运算符与双目运算符

1) 双目运算符重载

对于双目运算符的重载,有两种方式:

  • 带有1个参数的非静态成员函数

  • 带有2个参数的非成员函数

对于任意类型的双目运算符@,则aa@bb可以被解释为aa.operator@(bb)或者operator@(aa, bb)。假如上述两种重载方式都被定义了的话,则由相应的规则(overload resolution)决定会被解释为哪种方式。例如:

class X{
public:
	void operator+(int);
	X(int);
};

void operator+(X,X);

void operator+(X, double);

void f(X a)
{
	a + 1;    //a.operator+(1)
	1 + a;    //::operator+(X(1),a)
	a + 1.0;  //::operator+(a, 1.0)
}

2) 单目运算符重载

对于单目运算符重载,不管是prefix还是postfix,也有两种方式:

  • 不带参数的非静态成员函数

  • 带有1个参数的非成员函数

对于任何前置(prefix)单目运算符@@aa可以被解释为aa.operator@()或者operator@(aa),假如两种重载方式均被定义了的话,则由相应的规则(overload resolution)决定会被解释为哪种方式。

对于任何后置(postfix)单目运算符@aa@可以被解释为aa.operator@(int)或者operator@(aa, int)。同样假如两种重载方式均被定义了的话,则由相应的规则(overload resolution)决定会被解释为哪种方式。

注意,我们并不能改变一个运算符的单目性与双目性。

class X{
public:                 //members(with implict this pointer)

	X* operator&();     //prefix unary &(address of)
	X operator&(X);     //binary &(and)
	X operator++(int);  //postfix increment 
	X operator&(X,X);   //error: ternary &
	X operator/();      //error: unary /
};

//nonmember functions:

X operator-(X);         //prefix unary minus 
X operator-(X,X);       //binary minus
X operator--(X &, int); //postfix decrement
X operator-();          //error: no operand
X operator-(X,X,X);     //error: ternary
X operator%(X);         //error: unary

对于操作符operator=, operator[], operator(), operator->必须被定义为非静态成员函数。

note: operator->为dereferencing运算符

对于运算符重载函数,其所支持的参数传递方法只有:

  • Pass-By-Value(按值传递)

  • Pass-By-Reference(按引用传递)

在参数传递中并不支持指针。

2. 特殊运算符重载

在上面的章节中我们介绍了一些基本的运算符重载,在下面我们将对一些较为特殊的运算符进行介绍:

[]    ()    ->     ++    --    new    delete

2.1 下标操作符

一个operator[]函数可以被用于类对象的下标操作,其中函数的参数可以是任何类型,这就使得其可以被用于vector、关联数组等数据结构中。

如下例子中,我们可以定义一个简单的关联数组类型:

struct Assoc{
	vector<pair<string,int>> vec;     //vector of {name, value} pairs

	const int& operator[](const string &) const;
	int& operator[](const string &);
};

上面Assoc对象维持了一个vector,其中vector的每一个元素是std::pair。如下我们使用一种常用但低效的方式来实现:

//search for s; return a reference to its value if found;
//otherwise,make a new pair {s,0} and return a reference to its value
int& Assoc::operator[](const string & s)
{
	for(auto x : vec)
		if(s == x.first)
			return x.second;

	vec.push_back({s, 0});        //initial value: 0

	return vec.back().second;     //return last element
}

有了上述重载函数之后,我们就可以按如下方式来使用Assoc:

int main(int argc, char *argv[])
{
	Assoc values;

	string buf;
	while(cin >> buf) 
		++values[buf];

	for(auto x : values.vec)
		cout<<'{'<<x.first<<','<<x.second<<'}'<<endl;

	return 0x0;
}

注: operator[]必须是一个非静态成员函数

2.2 Function Call

函数调用,其表现形式为expression(expression-list),可以被解释为一个双目操作符,其中expression可以被认为是左操作数,expression-list可以被认为是右操作数。对于函数调用操作符()其同样也可以被重载,例如:

struct Action{
	int operator()(int);

	pair<int, int> operator()(int, int);

	double operator()(double);
	
	// ...
};

void f(Action act)
{
	int x = act(2);
	auto y = act(3,4);

	double z = act(2.3);

	//...
}

对一个object进行()运算符重载,这样可以使得其行为类似于仿函数。这样一种函数对象(function object)使得我们可以在写代码的时候将其作为参数来执行一些特定操作,例如:

class Add{
	complex val;

public:
	Add(complex c):val{c}{}                       //save a value

	Add(double r, double i):val{}

	
	void operator()(complex &c) const{ c += val;}    //add value to argument
};

上述Add类首先会使用一个complex对象来进行初始化,当Add对象通过使用()来调用时,其就会将该值加到对应的调用参数上。例如:

void h(vector<complex> &vec, list<complex>& lst, complex z)
{
	for_each(vec.begin(), vec.end(), Add{2,3});

	for_each(lst.begin(), lst.end(), Add{z});
}

注: operator()()必须是一个非静态成员函数

下面给出一个完整的例子:

#include <iostream>
#include <algorithm>
#include <vector>
#include <list>
#include <complex>
	

class Add{
	std::complex<double> val;
	
public:
	Add(std::complex<double> c):val(c){}
	
	Add(double r, double i):val(r,i){}
	

	void operator()(std::complex<double> & c){
		c += val;
	}

};



void hfunc(std::vector<std::complex<double> >& vec, std::list<std::complex<double> > &lst, std::complex<double> z)
{
	std::for_each(vec.begin(), vec.end(), Add(2,3));
	
	std::for_each(lst.begin(), lst.end(), Add(z));
}


int main(int argc, char* argv[])
{
	std::vector<std::complex<double> > vec;    //注: 这里std::complex<double>后必须要有一个空格,否则VC6.0中编译不过
	std::list<std::complex<double> > lst;
	std::complex<double> z(10,10);
	
	vec.push_back(std::complex<double>(1,1));
	vec.push_back(std::complex<double>(2,2));
	
	lst.push_back(std::complex<double>(3,3));
	lst.push_back(std::complex<double>(4,4));
	
	hfunc(vec, lst, z);
	
	for(std::vector<std::complex<double> >::iterator it = vec.begin(); it != vec.end();it++)
		std::cout<<*it<<std::endl;
	
	
	for(std::list<std::complex<double> >::iterator it2 = lst.begin(); it2 != lst.end(); it2++)
		std::cout<<*it2<<std::endl;

	return 0x0;
}

编译运行:

# gcc -o test test.cpp -lstdc++
# ./test
(3,4)
(4,5)
(13,13)
(14,14)

注,std::for_each()函数实现其实类似如下:

template<typename InputIterator, typename Function>
Function for_each(InputIterator beg, InputIterator end, Function f) {
	while(beg != end) 
		f(*beg++);
}

2.3 Dereferencing

解引用操作符->可以被定义为一个单目后置操作符(unary postfix operator),例如:

class Ptr{
	//...
	X* operator->();
};

Ptr类对象可以被用于访问类X的成员,类似于指针操作。例如:

void f(Ptr p)
{
	p->m = 7;    //(p.operator->())->m = 7
}

->运算符重载经常会被用于实现智能指针。标准库中的智能指针unique_ptr以及shared_ptr均对->进行运算符重载。

值得注意的是,对于普通的指针,通常在使用->时其与单目运算符*[]具有相同的含义,例如:

p−>m == (∗p).m           //is true
(∗p).m == p[0].m        // is true
p−>m == p[0].m          // is true

但是对于->重载运算符,一般天然是没有这样相同含义的保证。如果要提供类似相同的含义,我们通常需要进行进一步的重载保证:

template<typename T>
class Ptr {
	Y∗ p;

public:
	Y∗ operator−>() { return p; }            // dereference to access member
	Y& operator∗() { return ∗p; }            // dereference to access whole object
	Y& operator[](int i) { return p[i]; }    // dereference to access element
	// ...
};

注:运算符->重载必须是一个非静态(non-static)成员函数,并且其返回值必须是一个指针或者是一个可以使用->的类对象。

虽然->.操作符含义相似,但是我们并不能对.(成员选择符)运算符进行重载。

2.4 Increment and Decrement

在智能指针(smart pointer)被发明之后,通常我们还会提供自增操作(++)与自减操作(–),以使其更类似于C++的内置类型。在C++运算符中,increment 与 decrement运算符较为特殊,其既可以作为前置运算符,也可作为后置运算符。因此,我们在运算符重载时需要提供前置与后置两种,例如:

template<typename T>
class Ptr{
	T *ptr;
	T *array;
	int sz;

public:
	template<int N>
	      Ptr(T *p, T(&a)[N]);      //bind to array a, sz == N, initial value p

	Ptr(T *p, T *a, int s);         //bind to array a of size s, initial value p

	Ptr(T *p);                      //bind to single object, sz == 0, initial value p

	Ptr& operator++();              //prefix
	Ptr operator++(int);            //postfix

	Ptr& operator--();              //prefix
	Ptr operator--(int);            //postfix

	T& operator*();                 //prefix
};

在上述的运算符重载函数中,参数int用于指明该运算符是进行的后置重载。在该函数中参数int是不会被使用到,其仅仅是作为一个dummy用于区分是前置运算符重载还是后置运算符重载。

2.5 Allocation and Deallocation

1) 理论介绍

我们知道new运算符会调用operator new()来获得其所需要的内存,类似地,delete运算符会通过调用operator delete()来释放其所占用的内存。用户可以对全局的operator new()operator delete()进行重载,也可以对某个特定类(particular class)进行的operator new()operator delete()进行重载。

使用标准库(standard-library)中的size_t类型作为参数,我们可以通过如下方式来对全局(global)的new/delete运算符进行重载,例如:

void * operator new(size_t);               //use for individual object
void * operator new[](size_t);             //use for array
void operator delete(void *, size_t);      //use for individual object
void operator delete[](void *, size_t);    //use for array

当我们需要在自由空间(free store)上为X类型的对象分配内存时,我们就可以使用new操作符,其就会调用operator new(sizeof(X))来分配内存;类似地,当我们需要在自由空间上通过new来为含有N个元素且类型为X的数组分配空间时,其就会调用operator new[](N*sizeof(X))。new表达式也许会分配多于参数所指定的N*sizeof(X)大小的内存,这在为字符串分配空间时经常会这样。

通常我们并不推荐对全局的operator new()与operator delete()进行重载,因为这造成的影响太大。更好的选择是,单独为某个class提供new/delete运算符重载。该class可以是多个派生类的基类。在如下的例子中,Employee类就为其本身及其派生类提供了一个特定的allocator与deallocator:

class Employee{
public:
	//...

	void * operator new(size_t);
	void operator delete(void *, size_t);

	void * operator new[](size_t);
	void operator delete(void *, size_t);
};

对于operator new()operator delete()函数,其实际上是static成员。因此其并没有this指针,也并不能修改一个对象。它们只负责提供相应的空间,使得可以通过constructor来初始化一个对象,以及通过destructor来释放一个对象占用的空间。

void *Employee::operator new(size_t s)
{
	//allocate s bytes of memory and return a pointer to it
}

void Employee::operator delete(void *p, size_t s)
{
	if(p){     //delete only if p!=0;

	      //assume p points to s bytes of memory allocated by Employee::operator new()
	      //and free that memory for reuse
	}
}

到此为止,对于为什么要使用神秘的size_t参数就变得显而易见了。size_t用于指定被删除对象的大小。删除一个普通的(plain)Employee对象我们可以传递sizeof(Employee);而删除一个派生自Employee的Manager对象,假如Manager并没有其自身的operator delete()函数时,其所传递的值就为sizeof(Manager)。这样就使得一个class-specific allocator不用在每次内存分配时另外保存额外的size信息。自然地,一个class-specific allocator也可以保存size_t信息(类似于通用的allocator),这样调用operator delete()删除时就可以忽略size_t参数。然而,如果不提供size_t参数,这通常使得我们难以较大的提高内存分配速率。

编译器如何为operator delete()提供正确的size_t呢?delete运算符会匹配所要删除对象的类型。假如我们通过一个父对象的指针来删除一个派生类对象的话,则父类必须要有一个virtual析构函数来提供正确的对象空间大小:

Employee∗ p = new Manager;   // potential trouble (the exact type is lost)
// ...
delete p;                    // hope Employee has a virtual destructor

通常,deallocator会在析构函数之后被调用(析构函数知道其对应的类大小)

2) 示例

当我们在C++中使用new和delete时,其实执行的是全局的::operator new()和::operator delete()。首先我们来看一个简单的例子:

class Foo{...};
Foo *pf = new Foo;

delete pf;

上面的代码底层执行的是什么呢?

new包含两阶段的操作:首先调用::operator new()分配内存; 之后调用 Foo::Foo()构造对象内容

delete也分为两部分的操作: 首先调用Foo::~Foo()将对象析构; 之后调用::operator delete()释放内存

如下我们给出一个示例对new/delete进行重载:

#include <stdio.h>
#include <stdlib.h>
#include<iostream>
using namespace std;

class Foo
{
public:
	int _id;
	long _data;
	string _str;
public:
	Foo():_id(0){
		cout<<"default constructor.this="<<this<<" id="<<_id<<endl;
	}
	Foo(int i):_id(i){
		cout<<"constructor.this="<<this<<" id="<<_id<<endl;
	}
	~Foo() {
		cout<<"destructor.this="<<this<<" id="<<_id<<endl;
	}
	
	static void* operator new(size_t size);
	
	static void operator delete(void* pdead,size_t size);
	
	static void* operator new[](size_t size);
	
	static void operator delete[](void* pdead,size_t size);
};

void* Foo::operator new(size_t size)
{
	Foo* p = (Foo *)malloc(size);
	char *q = (char *)p;
	long *r = (long *)(p+4);
	*r = 20;
	
	cout<<"调用了Foo::operator new"<<endl;
	return p;
}

void Foo::operator delete(void *pdead,size_t size)
{
	cout<<"调用了Foo::operator delete"<<endl;
	free(pdead);
}

void* Foo::operator new[](size_t size)
{
	Foo* p  = (Foo*)malloc(size);
	cout<<"调用了Foo::operator new[]"<<endl;
	return p;
}

void Foo::operator delete[](void *pdead, size_t size)
{
	cout<<"调用了Foo::operator delete[]"<<endl;
	free(pdead);
}

int main(int argc, char *argv[])
{
	Foo* pf = new Foo(7);
	Foo* pf1 = new Foo[10];

	cout<<"_data:"<<pf->_data<<std::endl;

	delete pf;
	delete[] pf1;

	return 0x0;
}

编译运行:

# gcc -o test test.cpp -lstdc++
# ./test
调用了Foo::operator new
constructor.this=0x1880010 id=7
调用了Foo::operator new[]
default constructor.this=0x1880038 id=0
default constructor.this=0x1880050 id=0
default constructor.this=0x1880068 id=0
default constructor.this=0x1880080 id=0
default constructor.this=0x1880098 id=0
default constructor.this=0x18800b0 id=0
default constructor.this=0x18800c8 id=0
default constructor.this=0x18800e0 id=0
default constructor.this=0x18800f8 id=0
default constructor.this=0x1880110 id=0
_data:0
destructor.this=0x1880010 id=7
调用了Foo::operator delete
destructor.this=0x1880110 id=0
destructor.this=0x18800f8 id=0
destructor.this=0x18800e0 id=0
destructor.this=0x18800c8 id=0
destructor.this=0x18800b0 id=0
destructor.this=0x1880098 id=0
destructor.this=0x1880080 id=0
destructor.this=0x1880068 id=0
destructor.this=0x1880050 id=0
destructor.this=0x1880038 id=0
调用了Foo::operator delete[]

最后看结果和我们预想的一样,::operator new()和::operator delete()都被重载了,并且执行顺序也是我们预想的。但是如果使用全局的::operator new和::operator delete()会怎样呢?

int main(int argc, char *argv[])
{
	Foo* pf = ::new Foo(7);
	Foo* pf1 = ::new Foo[10];

	cout<<"_data:"<<pf->_data<<std::endl;

	::delete pf;
	::delete[] pf1;

	return 0x0;
}

编译运行:

# gcc -o test test.cpp -lstdc++
# ./test
constructor.this=0xcb7010 id=7
default constructor.this=0xcb7038 id=0
default constructor.this=0xcb7050 id=0
default constructor.this=0xcb7068 id=0
default constructor.this=0xcb7080 id=0
default constructor.this=0xcb7098 id=0
default constructor.this=0xcb70b0 id=0
default constructor.this=0xcb70c8 id=0
default constructor.this=0xcb70e0 id=0
default constructor.this=0xcb70f8 id=0
default constructor.this=0xcb7110 id=0
_data:0
destructor.this=0xcb7010 id=7
destructor.this=0xcb7110 id=0
destructor.this=0xcb70f8 id=0
destructor.this=0xcb70e0 id=0
destructor.this=0xcb70c8 id=0
destructor.this=0xcb70b0 id=0
destructor.this=0xcb7098 id=0
destructor.this=0xcb7080 id=0
destructor.this=0xcb7068 id=0
destructor.this=0xcb7050 id=0
destructor.this=0xcb7038 id=0

看到我们重载的函数被屏蔽了,因为使用的是全局::operator new()和::operator delete()。

2.6 输出运算符重载

这里直接给出一个示例:

#include <iostream>

class Person{
private:
	std::string name;
	int age;
	
public:
	Person(std::string name, int age):name(name),age(age){}
	
	friend std::ostream & operator<<(std::ostream &os, const Person &person){
		os<<"name:"<<person.name<<"  age:"<<person.age<<std::endl;
		return os;
	}
	
};

int main(int argc, char *argv[]){

	Person person1("test1", 10);
	Person person2("test2", 20);
	
	std::cout<<person1<<person2<<std::endl;
	
	return 0x0;
}

编译运行:

# gcc -o test test.cpp -lstdc++
# ./test
name:test1  age:10
name:test2  age:20

3. 友元

在C++类中,一个普通的成员函数通常具有如下特征:

  • 成员函数能够访问类中所声明的私有成员

  • 成员函数的作用范围是其所属类

  • 成员函数必须通过一个object来调用(即要有this指针)

通过将一个成员函数声明为static,这可以使得其具有上面的头两个特性。通过将一个非成员函数声明为friend,则可以具有第一个特性。将一个函数声明为friend,使得其可以访问对应类的私有成员,但其作用域却可以保持与类相独立。

举个例子,我们可以定义一个操作符用于实现Matrix与Vector的乘积。自然,Matrix与Vector都隐藏了各自的实现细节,并各自提供了一整套函数来操作内部细节。然而,我们的乘积函数并不能是双方的成员函数,同时我们也并不希望提供一个低层级(low-level)的函数来使得每个用户都能够完整的读写Matric与Vector。为了避免此问题,我们可以将operator *()声明为双方的friend:

constexpr rc_max {4};      // row and column size

class Matrix;

class Vector {
	float v[rc_max];

	// ...
	friend Vector operator∗(const Matrix&, const Vector&);
};

class Matrix {
	Vector v[rc_max];

	// ...
	friend Vector operator∗(const Matrix&, const Vector&);
};

现在operator *()就能够深入到Vector与Matrix的内部实现细节。这可能需要复杂的实现技术,如下是一个简易版本:

Vector operator∗(const Matrix& m, const Vector& v)
{
	Vector r;
	for (int i = 0; i!=rc_max; i++) { // r[i] = m[i] * v;
		r.v[i] = 0;
		for (int j = 0; j!=rc_max; j++)
			r.v[i] += m.v[i].v[j] ∗ v.v[j];
	}
	return r;
}

一个友元函数的声明既可以放在类的public部分,也可以放在private部分,与位置无关。类似于成员函数,friend函数也是被显示的声明在类中,因此其也作为对应类接口的一部分。

一个类的成员函数可以是另一个类的友元函数。例如:

class List_iterator{
	//...
	int * next();
};

class List{
	friend int * List_iterator::next();
	//...
};

另外,还有一种简便的方法可以使得一个类的所有成员函数均是另一个类的友元。例如:

class List {
	friend class List_iterator;
	// ...
};

上述friend的声明使得List_interator的所有成员函数均是List的朋友。

将一个类声明为友元,使得该类的每一个函数均可访问相应类的私有变量。但这可能会破坏类的封装特性,使用友元类的时候要特别小心,一般也只会用在具有紧密关联的两个类间。

另外,也可以将一个template参数声明为友元:

template<typename T>
class X {
	friend T;
	friend class T; // redundant ‘‘class’’
	// ...
};

3.1 友元的查找

在进行友元查找时,其遵循的规则为:

1) 一个友元(friend)必须在一个封闭区域内被事先声明

或

2) 在被声明为friend的类外即刻定义

假若当前有namespace::N,则定义在namespace::N{}外部且在该名称空间之后类或函数,均不能成为namespace::N中某个类的友元。如下举例:

class C1{};            //will become friend of N::C
void f1();             //will become friend of N::C

namespace N{
	class C2{};        //will become friend of C
	void f2(){}        //will become friend of C

	class C{
		int x;

	public:
		friend class C1;       //OK(previously defined)
		friend void f1();   

		friend class C3;       //OK(defined in enclosing namespace)
		friend void f3();
		friend class C4;       //first declared in N and assume to be in N
		friend void f4();
	};


	class C3{};                  //friend of C
	void f3(){C x; x.x = 1;}     //OK, friend of C

}  //namespace N

class C4{};                    //not friend of N::C
void f4(){N::C x; x.x = 1;}    //error: x is private and f4()is not a friend of N::C



[参看]:

  1. C++ 内存管理之重载operator new 和operator delete