炙手可热的5G,如何逼近信道容量的香农极限?
2019年6月6日,工信部正式发放5G商用牌照,标志着5G即将迈入商用阶段。中国的通信行业在经历了“1G空白,2G追随,3G参与,4G 并跑”的阶段后,终于在5G时代成为了领跑者之一。但对于大多数普通用户而言,5G仍是一个模糊的概念。5G究竟是什么?在带宽资源有限的情况下,如何做 到传输速率的大幅提升?
5G相当热。
从英国首次5G电视直播,到5G牌照的发放;从对华为的制裁,到美国议员说要赖掉华为的专利,近一个月的新闻实在是让人目不暇接。
但是,5G究竟是什么?有什么关键技术?背后又有什么故事?为了做一名合格的“吃瓜群众”,我们最好还是来了解一下。
了解了这些概念,至少在茶余饭后吹牛的时候,你会显得比别人有档次。
从香农公式说起
作为一个老司机,你一定清楚,车要跑得快,路要宽,路面要平,油还要给足。同样,上网速度想提高,信号传输的通道要宽,噪声要小,信号功率还要大。
但是,1948年以前,没有人能清楚地描述信号传输速率和通道宽度、噪声大小以及信号功率的关系。直到香农提出了信息论,给出了香农公式:
C是单信道的信道容量,是指我们建立了一个单点输入、单点输出的通信通道(我们称为信道)后,这条通道每秒最多可以传送多少bit的信息量。B 是信道的带宽,可以简单理解为分配给一个信道可用的频率范围的一半;S是传送信号的平均功率,而N则是噪声或者干扰信号的平均功率。
从香农公式可知,对于单信道而言,要增加信道容量C,无非三种方式:或增加带宽B,或增加信号功率S,或减少噪声或干扰信号的功率N。
八卦一下
新浪大V王小东引用别人的说法,认为中心频率越高,带宽就越大。翻开科普书,你也会发现上面写着,光纤之所以比电线好是因为带宽大。其实,现代 无线通信技术使用的频率都已经相当高了。所以中心频率的高低,除了极限情况(比如需要非常宽的带宽,到达奈奎斯特频率对带宽的限制)之外,一般不会构成对 带宽的限制。
所以现在,“频率越高,传输的信息量越大”这一观念并不完全正确。实际上,信息量只关乎带宽,不关乎中心频率。这一点,香农公式已经告诉你了。
随着无线通信的发展,带宽也好,功率也好,这些资源只会越来越紧张,而空间中无线电的相互干扰也只会越来越大。
怎么办?
天无绝人之路。对于有多个输入和多个输出的信道而言,即使不改变以上三个条件,只要能保证该系统中的各输入源或输出源的信号可以彼此区分,就可以提高总的信道容量。
比如,假设有一个单输入双输出的信道,并且,我们可以通过某种方式区分每个输入信号到底是该到达输出1,还是该到达输出2。那么,这个系统就可以看成两个独立的信道:一个是从输入到输出1,一个是从输入到输出2。
如果这个模型是无线电传输的,则信道的噪声N不会变化。信号总功率还定为S,每个信道各分一半,即S/2。那么我们很容易推算,这个信道的总容量为:
C=B log2(1+S/2N)+B log2(1+S/2N)
=2B log2(1+S/2N) (2)
为了做个简单比较,我们假定S/N=10,B=1Hz,就很容易算出在单信道的情况下,单信道容量约为3.46Bits/S,而新的信道的总容 量为5.17Bits/S。5G,即第五代移动通信,主要就是利用多输入与多输出技术(Multiple-Input Multiple-Output,MIMO)来提高信道容量的。
这个例子还给我们另外一个启示:牺牲单个信道的功率,虽然单个信道的容量有所降低,但是这个降低却能换来信道数目的增长。因此,有的时候,牺牲 一定的带宽、提高一点噪声或是降低一点信号功率,如果能使输入或输出信号之间的区分度增加,也是可以提高信道总容量的。这正是5G的另一类重要技术,非正 交复用技术(Non-Orthogonal Multiple Access,NOMA)的原理基础。
补充:蜂窝移动通讯的基本结构
在了解MIMO和NOMA之前,让我们对现在手机通信依赖的蜂窝移动通信的结构先有个基本了解。
如下图。手机的信号传递,是靠离它不远的基站,也就是图中画的那些天线样的东西来实现的。这些基站一般几公里布置一个(5G要降到300米左右 一个基站)。一般情况下,基站的位置会放在一个六角形“蜂巢”的中央,以保证基站发出的信号可以最好地覆盖手机工作的区域。正是这个原因,手机用的移动通 信网络被称作“蜂窝移动网络”。
基站的信号一般通过光纤,被送到一些设备构成的系统网络。这个系统叫“核心网”,它会对基站送来的信号进行分拣和检查,然后,把属于电话、短信 或微信等数字通信的信号,分门别类送进相应的公用网络,比如电话的网络、因特网的网络等。同时,核心网还会把手机用户在哪个基站附近通信、用了多少流量等 信息送到服务与管理中心,用来进行计费等工作。
多输入与输出技术
先说多输入与多输出技术(MIMO)。
对于无线通信而言,MIMO是指在基站上使用更多数量的天线。这当然就意味着在不增加频带和功率的情况下增加信道容量。
最能在直观上体现这种信道容量增加的,是波束赋形(beam forming)技术[1]。
我们都很清楚,无线电波是一种电磁波,和水波、声波一样,有相干现象。如图3所示,如果使用很多天线发射同样频率的电磁波,控制好发射的波的相 位,就可以让这个信号向一个或几个特定的方向传播。这样的信号不仅能量集中,远距离传输时功率也不会急剧降低,还可以区分不同的空间位置。利用这种区分 度,也就相当于建立了更多的信道。
而MIMO的一般解释要涉及无线电信号的基本传输模型,这里我就不展开讲解了。只是给出当接收和发射天线都比较多时,其信道容量的常见的估计公式:
C=min(mR,mT)B log2(1+S/N)(3) [2]
这里mT和mR分别是信道中发射和接收天线的数量,min表示mT和mR两者中的最小值。可见,天线数量的增加,大大提升了系统的信道容量。
非正交复用技术
非正交复用技术(NOMA)是指利用某种资源差异(比如接收功率差异、空间位置差异等)来区分不同接收手机的收发信号的技术。由于这些手机和基站之间使用的是同一个频道,只通过资源差异做一定区分,这在通信技术上意味着无法划出独立的信道,所以叫“非正交”。
最成熟的NOMA方式是利用功率差异。[3]如图4,基站通过功率检测发现,手机1、2、3依次从近到远分布。那么,基站就可以把发给3的信号功率调到最强,发给2的次之,发给1的最弱。这些信号可以在同一个频段内发出。
于是,在手机1收到的信号中,最强的信号是3的,其次是2的,最弱的才是自己的。那么,手机1就可以先将其他信号当成噪声,解出3的信号,然后将3的信号从接收信号中扣除。再在经过扣除的信号中,解出2的信号并扣除。最后才解出自己的信号。
而对于手机2,由于其离基站有一定的距离,所以收到的1的信号相当弱,只要将其当噪声就可以了。剩下要做的,就是参照上面的方法,扣除手机3的信号,解出自己的信号。
手机3就更不必说了,它收到的手机1、2的信号都相当弱,只需解出自己的信号就可以了。
这种信号处理的方式叫作“连续干扰消除”(successive interference cancellation ,SIC),是指通过一连串信号的扣除来去掉干扰。
正是通过这样的方式,我们再次提高了信道的容量。
八卦一下
搜狐张朝阳曾经在视频节目中提到,5G要求的速率大,使用的频率也偏高,估计使用的功率也会偏大,会不会因此对人体造成损害?
他的问题也是很多人担心的。
通过这两节的说明,我们知道,5G主要是通过增加信道,而非增加功率的方式,来提高速率的。
5G(第5代移动通信)使用的低频频段,跟我们现在用的4G(第4代移动通信)没有本质差异,而高频频段则是以前卫星用来跟地面进行通信的频段。这些频段,在一定功率范围内,对人体都没有什么影响。 [4, 5]
逼近香农极限
信道容量,是理论上的一个极限值,被称为香农极限(Shannon limit)。
真实的通信过程,要接近极限并不容易。为了对抗信道中的干扰,我们必须对要传递的信息进行编码。这样一来,在大多数情况下,即使传送的信号由于 受到干扰而在到达目的地时出错,我们也能根据出错情况把原始信息恢复出来。比如,在干扰不太严重时,我们把同样的码传上3遍,然后3判2,一般就能恢复信 息。当然,这样编码的效率非常低,浪费了信道的容量。
而一个好的编码,不但要能克服噪声或者干扰,其中用来克服干扰的信息位数还要足够少,这样才有可能接近香农极限。
这样的码虽说不好找,但真找起来也不是特别困难。
不过,人们很快就发现,很多码的解码过程实在太复杂,没有办法设计出能马上解码的芯片。
1993年,法国的Berrou、Glavieux 和他们的缅甸籍博士生Thitimajshima [6]发布了Turbo码,采用了大多数研究编码的学者都没有注意的一种方式[7],即所谓“软判决” 的方式来译码。第一次,我们在实用意义上接近了香农极限。4G通信,采用的就是Turbo码。但是,软判决虽然比较容易实现,但其计算过程需要迭代,不能 并行,所以提速是个问题。
而5G的速度要求要比4G快至少10倍以上。因此,我们需要的译码方案不仅要能容易实现,最好还能并行计算以提升速度。
第一个被关注的码是LDPC码,其提出者是香农的学生Gallager。该编码在上世纪60年代被首次提出时,因当时的硬件不能满足编码的要求 而被搁置。直到Turbo码被提出,大家才发现,LDPC码有相似的译码性能,在长码时更接近香农极限,且并行性也不错。所以,在向5G前进的过程中,大 量学者都把注意力放在了LDPC码上。[8]
2008年,Gallager的学生,土耳其毕尔肯大学的Erdal Arikan教授提出了Polar码 [9]。由于大家的关注点都在LDPC码上,所以他的发现在欧美厂商那里受到了冷遇。[10]
Polar码
讲述Polar码,需要非常专业和繁复的背景知识。但是,我们可以讲点简单的东西,来“浅尝”一下Polar码。
如图5,隔壁老王要给张三传递消息,但又不想让李四知道,怎么办?他就想到用纸牌来送消息,牌面朝上表示明天有空,朝下表示明天忙。但是,老王 碰到了两个麻烦。一个麻烦是,附近有个小孩总会在张三、李四不在时来翻牌,会有40%的可能把牌翻个面(如图5,小孩把第一张牌翻了面)。另外有个麻烦 是,李四多次观察,已经知道了纸牌正面和反面的含义。于是,老王决定用两张牌,第二张牌的含义还跟原来一样,正面表示有空,反面表示忙,但第一张牌则用来 跟张三进行事前约定,约定两张牌的牌面是相同还是相反(图5所示的就是相反)。通过这样的方法,老王认为他既能更好地对抗小孩的干扰,也能防止李四猜准结 果。请问,老王的办法靠谱吗?
信息论回答我们,靠谱!
先看李四碰到的情况。
如果李四直接通过第二张牌来判断老王是否有空,那么准确率只有60%。这个准确率还能不能再提高呢?比如,李四可不可以先猜猜老王事先跟张三的 约定是什么?如果老王决定两张牌同面和反面的概率各为50%,那么,通过概率论计算,李四推断出约定内容的可能性最多为52%。如果他想在此基础上再推断 牌面的准确含义,也就是想同时猜准约定的内容和老王是否有空,那么结果只会更糟,只有36%的可能猜对。总的看来,还不如直接用第二张牌的6成把握算了。
再说张三。比如图5中的情况,既然事先约好了牌面相反,张三一看牌面相同就知道被小孩动过手脚,便会直接根据第二张牌推断,准确性即6成;但是,假设张三碰上的是牌面相反的情况,那么,通过概率论计算,他判断的准确率将一跃至69%,比60%高了不少。
总结起来,我们可以认为张三占了好信道,好的时候准确率高达69%;而李四占了烂信道,他不像张三能提前知道老王的约定,他猜对约定内容的准确率只有52%。这个概率着实不高,因为我们都知道,李四就算乱猜其实也有50%的机率猜对。
信道分了好和烂,就是极化(Polarization),也就是两极分化的意思。
(这个计算过程并不严格,只是为了展示极化现象。真正要理解极化现象,还是需要信息论的基础。具体的计算见附录。)
所谓极化码的编码技术,就是以一种比较复杂的嵌套方式,并使用足够多的牌,通过老王的约定,最后产生非常严重的信道极化。可以从数学上证明,只 要有足够多的牌,李四到最后啥也猜不到;而只要张三事前知道了足够多的约定内容,那么再严重的小孩干扰,都挡不住老王传递的每一个信息。当然,小孩干扰的 情况越轻,需要的约定越少。
标 准
“一流厂商做标准,二流厂商做方案,三流厂商做产品。”这是通信行业的共识。
为什么呢?因为通信行业是依靠信息的传输而存在的。而通信标准就是信息传播和电信运营商运营的基础。比如,你打电话,必须规定什么样的声音是忙音,什么样的声音是打通了的声音。这就是标准。
实际上,电信标准的主要制定者——国际电联(International Telecommunication Union)在1865年成立时,就是为了统一标准而结成的联盟。1865年5月17日,由奥地利和法国发起,为了统一各个国家的电报格式、资费等问 题,20多国参与结成万国电报公会(International Telegraph Union),即国际电联的前身。而当时清政府历经50年,才加入万国电报公会,仅为中文码字收费一项,就和万国公会进行了很久的协商。
由此可见,标准对通信业是多么重要。[11]
到了现代,通信标准越来越复杂,与之配套的专利、芯片、设备和软件也越来越复杂。所以只要制定了标准,也就意味着从技术、硬件到软件都占得先 机。比如,在第三代移动通信有三大标准,WCDMA、CDMA2000和TDS-CDMA。而实现CDMA(Code Division Multiple Access,码分多址)的核心技术就在高通公司(Qualcomm)[12]手中。因此,当时的高通公司除了卖芯片,还向世界各地的电信设备商和运营商 收取相关技术的专利费用,赚得盆满钵满,从1985年7个人创立的小公司一跃成为世界上最重要的通信企业之一。高通的例子清楚地诠释了什么是“一流企业做 标准”。
但是,标准不是你想做就能做的,因为如果没有技术上可实现的有吸引力的方案,也就不会有众多的厂家支持,你的方案是不会被国际电联或其委托的相 关机构选为标准,此其一;另外,也不是有了标准就一定会挣钱,因为如果缺乏相应比较经济实用的实现技术,标准依然不会转成效益,此其二。
而Polar码,比之LDPC码,译码复杂度低。若研发其相应技术,一定会吸引大量的厂家,并带来经济的实现方案。因此,其技术若实现,相应方案是有可能进入新一代无线通信的标准并带来效益的。
2010年,由于加拿大北电倒闭[13]而在2009年加入华为的童文,敏锐地察觉到了Polar码的巨大潜力。虽然,Polar码译码有一定的串行性,但是解码本身复杂度很低。所以,他决定冒一次险,豪赌一把,在工程上实现Polar码的应用。[14]
实践证明,童文赌对了。众所周知,在5G标准的制定中,Polar码以在测试中更优异的性能胜过了Turbo/LDPC码,并最终成为了eMBB场景的短码控制信道编码方案。[15]
而随着标准的制定,华为有更多的专利进入了“标准必要专利”(表1)。
什么是“标准必要专利”?就是你一旦要采用这个通信标准来生产设备或进行运营,就必然会用到这些专利,并向专利持有的厂商缴纳专利费用。
这不但使华为从芯片到硬件都占尽先机,仅是相应的专利费也极为可观。
八卦一下
有很多朋友说,中国没有核心技术,不如高通等等。这个问题,我个人觉得,都没有“标准必要专利统计”来得准确。
另外需要补充的细节是:童文获得了2018年IEEE杰出行业领袖奖[17];Erdal Arikan教授获得了2019年香农奖[18]。
结 语
行将结束。
那些最最热门的话题,比如贸易战的诸多细节、芯片问题、频段问题、5G有什么用等等我都没有讲。
因为天气太热,我实在写不下去了。
广州这段时间不是大雨,就是高热。据说,这都是厄尔尼诺惹的祸。
为什么厄尔尼诺这么厉害?据说是全球升温造成的。
相比气候的上升,有关5G的诸多争论不过是小打小闹罢了。
在这人类欲望不受控制的世界里,长程来看,一切都变得不确定。
因此,我更怀念1948年的香农(Claude Elwood Shannon):
它叫香农熵。熵,即不确定。
附录:极化信道的说明
正文中极化码的例子,实际是对如图6的信道图的比喻。
解释图6相关计算如下:
有两个二元信号X1和X2,其可取的值为{0,1};这两个信号进行模2加(模2加的规则 是:0+0=0;0+1=1;1+0=1;1+1=0)后,则送入一个噪声信道W,其有60%的可能性维持原有的值输出到Y1,40%由于干扰而被误判成 另一个符号(即“0”被判成“1”, “1”被判成“0”);另外,X2直接通过一个干扰信道W,输出为Y2。
为了方便计算,我们将计算需要使用的各种概率值列表如下(假定X1和X2取“0”和“1”的可能性都是各占50%):
表1 Pr (Y1Y2 | X1X2)
非常容易推知,Y1和Y2取“0”和“1”的可能性也都是各占50%
现在我们来计算一下联合信道X1X2->Y1Y2传递的信息量:
而由信息论可知,若X1与X2独立,信道也可做如下分解:
由此可知,信道X1->Y1Y2传递的信息量远远低于平均的0.0290bit/sign;而信道X2->Y1Y2X1传递的信息量几乎等于原来两个信道联合传递的信息量,远高于0.0290bit/sign。