在 KeyStone 器件上实现高效的 LTE 下行控制信道基带发射
|
摘要 LTE 下行控制信道分为 PCFICH、PHICH 和 PDCCH 三类,PDCCH 是其中处理复杂度最高的。和下行数据信道 PDSCH 相比,下行控制信道承载的净荷较少、占用的 OFDM 符号数较少、传输模式也仅限于发射分集,理应占用更少的 DSP 核处理资源。但如下两个因素导致用户的实现可能消耗可观的 DSP 核资源:PHICH/PDCCH 的物理资源映射规则比PDSCH 更复杂、颗粒度更小,如果在每个下行子帧按照协议描述实时完成该映射所涉及的所有计算,消耗的核资源将非常可观;BCP 用户手册对 PDCCH 的描述较少,用户不易自行补全所有细节并产生高效方案,导致用户可能退而采用全软方案。另外,小基站应用通常对全系统功耗和成本有很高的要求,需要尽可能降低处理负载。本文给出了将实时计算量降至最低的物理资源映射实现方法,以及用 BCP 实现 PDCCH 比特级处理的方案细节,并提供了全面的硬件实测负载。 1、引言 LTE(Long Term Evolution)是由 3GPP 组织制定的 3G 演进标准,在物理层采用 OFDM和MIMO 技术。LTE 分为 FDD 和 TDD 两种双工模式。目前,LTE-FDD 在 20MHz 频谱带宽下的实际速率大约能达到下行 100Mbps、上行 50Mbps。LTE-TDD(国内通常称为 TD-LTE)的实际速率会随上、下行子帧的配比关系而变化。 [1][2][3][4]是主要的几个 LTE 物理层协议文本。[1]描述了上、下行发射机从星座点调制到基带信号上变频之间的处理步骤,通常称为符号级处理。[2]描述了星座点调制之前的处理步骤,通常称为比特级处理。[3]描述了各种物理层过程。[4]描述了各种物理层测量。 LTE 的上行信道包括用来传输数据和物理层随路控制信令的 PUSCH,专门用来传输物理层控制信令的 PUCCH,以及用于随机接入的 PRACH。下行信道包括用来传输数据的 PDSCH,用来传输各种物理层控制信令的三类控制信道——PCFICH、PHICH 和 PDCCH。本文描述的正是这三类下行控制信道的发射机基带实现。 TI 推出了一系列用于 LTE 基站基带处理的 SoC(System On Chip)。这些 SoC 基于 TI 的KeyStone 架构,该架构目前已演进了两代——KeyStone I 和 KeyStone II。KeyStone I 家族基于40nm 工艺,包括如下基带 SoC 器件型号: • TCI6616,详细资料参见[5] • TCI6618,详细资料参见[6] • TCI6614 和 TCI6612,详细资料参见[7]和[8] • TMS320C6670,详细资料参见[9] KeyStone II 家族基于 28nm 工艺,包括如下基带 SoC 器件型号: • TCI6636K2H,详细资料参见[10] • TCI6634K2K,详细资料参见[11] • TCI6638K2K,详细资料参见[12] • TCI6630K2L,详细资料参见[13] 所有这些器件都具有多模能力,支持 GSM/EDGE、WCDMA、TD-SCDMA、WiMAX、LTE 的单模实现或混模实现。所有这些器件使用的 DSP 核都是 c66x,但个数不同。TCI6614 和 TCI6612带一颗 ARM Cortex A8,TCI6636K2H 和 TCI6638K2K 带 4 颗 ARM Cortex A15,TCI6630K2L带 2 颗 A15,它们除支持物理层以外,还支持高层(层 2,层 3)和传输处理。这些器件也可用于基于 OFDM的无线回传(wireless backhaul),如 LTE relay 站。 本文介绍如何在上述 KeyStone 器件上高效地实现 LTE 下行控制信道的基带发射。注意,TCI6616 不带 BCP 加速器,和 BCP 相关的描述不适合 TCI6616。 和下行数据信道 PDSCH 相比,下行控制信道承载的净荷较少、占用的 OFDM符号数较少、传输模式也仅限于发射分集,理应占用更少的 DSP 核处理资源。但如下两个因素导致用户实际的实现可能消耗可观的核资源: • 每类下行信道在层映射/预编码之后、IFFT 之前,都要把星座点符号序列映射到各天线端口的物理资源上,而 PHICH/PDCCH 的物理资源映射规则比 PDSCH 更复杂、颗粒度更小,如果在每个下行子帧按照协议描述实时完成该映射所涉及的所有计算,消耗的核资源将非常可观。 • BCP 用户手册对 PDCCH 的描述较少,用户不易自行补全所有细节并产生高效方案,导致用户可能退而采用全软方案。 另外,小基站应用通常对全系统功耗和成本有很高的要求,需要尽可能地降低处理负载,因而对降低下行控制信道的处理负载有更强的需求。 本文给出了将实时计算量降至最低的物理资源映射实现方法,以及用 BCP 实现 PDCCH 比特级处理的方案细节,并提供了全面的硬件实测负载。 本文中的“符号”默认指的是 OFDM符号,星座点符号将采用全称以示区别。 2、LTE 下行控制信道简介 LTE 下行控制信道有 PCFICH、PHICH、PDCCH 三类。每个 1ms 子帧包含的符号数等于 14(normal CP)或 12(extended CP),下行控制信道独占前 1 到 3 个符号(当小区带宽<=10 个RB 时,独占前 2 到 4 个符号),三类下行控制信道共享此区域,实际占用符号数可以逐子帧变化,由 PCFICH 指示。子帧中剩下的符号被 PDSCH 独占。 有些符号上有小区参考信号(CRS),有些没有。每个符号内除去 CRS 后,每 4 个连续 RE 构成一个 REG。对存在 CRS 的符号,每个 RB 包含 2 个 REG;对其它符号,每个 RB 包含 3 个 REG。REG 是所有下行控制信道物理资源映射共同的基本单位。 关于帧结构、CP、RE、CRS、REG 等 LTE 基本概念,参见[1]。 本章的剩余部分将对下行控制信道的处理流程和关键特征做简要描述,以方便后面描述解决方案。完整信息参见下文给出的参考文献。 2.1 PCFICH 信道 PCFICH(Physical Control Format Indicator CHannel)总是位于每个下行子帧的第一个符号,占用 4 个 REG,用来指示该子帧中 PDCCH 占用的符号数。 PCFICH 基带发射机的结构如图 1 所示。层 2 下发的 CFI(Control Format Indicator)有 1、2、3三种取值,用 2 比特表示;经过码率为 1/16 的块编码得到 32 比特;随后的加扰步骤使用的扰码序列的初始状态为 2.2 PHICH 信道 PHICH(Physical Hybrid-ARQ Indicator CHannel)用于反馈上行 PUSCH 传输块的 CRC 校验结果。PHICH 在 PHICH duration 参数配置成 normal 时总是位于第一个符号,配置成 extended 时位于前 2(TDD 特殊子帧或 MBSFN 子帧)或 3 个符号(其它子帧)。TDD 时,子帧 1 和 6 是特殊子帧,而子帧 0 和 5 一定不会被配置成 MBSFN 子帧。MBSFN 子帧是用来支持广播业务的子帧,非 MBSFN 子帧称为单播子帧。 在 REG 的基础上,协议为 PHICH 定义了 PHICH group 和 PHICH mapping unit 这两个概念。3个 REG 构成一个 PHICH mapping unit,承载最多 8 个 PHICH。Normal CP 时,一个 PHICH group 对应一个 PHICH mapping unit,承载最多 8 个码分复用的 PHICH,扩频因子为 4;extended CP 时,一对 PHICH group 对应一个 PHICH mapping unit,这两个 PHICH group 分别占用每个 REG 中不同的 RE 对(一个 REG 有两个 RE 对),一个 PHICH group 承载最多 4 个码分复用的 PHICH,扩频因子为 2。
PHICH 基带发射机的结构如图 2 所示。层 2 下发的每个 HI(HARQ Indicator)有 0、1 两种取值,用 1 比特表示;经过码率为 1/3 的重复编码得到 3 比特;调制总是采用 BPSK;把每个调制符号扩频到 SF 个符号,SF 等于 4(normal CP)或 2(extended CP);随后的加扰步骤使用的扰码序列的初始状态和 PCFICH 完全一样,但长度只有 12(normal CP)或 6(extended CP);如前所述,extended CP 时,两个相邻 PHICH group 映射到同一个 PHICH mapping unit,在每个REG 内部,这两个 PHICH group 占用不同的 RE 对,这被称为资源 group 对齐;在每个天线端口上产生 12 个星座点符号,占用 3 个 REG,而且同一个 group 的所有 PHICH 信号需累加起来。
2.3 PDCCH 信道 PDCCH(Physical Downlink Control CHannel)用于承载上/下行调度、上行功控等信令。PDCCH 占用的符号数至少要和 PHICH 一样。表 2 给出了各种情况下一个子帧内 PDCCH 可能占用的符号数。
在 REG 的基础上,协议为 PDCCH 定义了 CCE(Control Channel Element)的概念,每个 CCE占用 9 个 REG。PDCCH 有 4 种格式,每种格式占用不同数量的 CCE,如表 3 所示。
所有 PDCCH 符号中除去被 PCFICH 和 PHICH 占用的 REG 之外的所有其它 REG 都属于PDCCH,其数量记为�REG,包含�CCE = ⌊�REG⁄9⌋个 CCE。 PDCCH 基带发射机的结构如图 3 所示。复用之前的步骤为每个 DCI 单独执行:计算 16 位 CRC,并将计算结果和该 DCI 对应的 16 位 RNTI 异或(对用于上行调度的 DCI 格式 0,如果相应 UE 使用发射天线选择,还要异或天线选择掩码来通知 UE 天线选择决策),添加到 DCI 净荷的尾部;信道编码采用尾比特卷积(CC)编码;随后的速率匹配采用和 CC 编码配套的速率匹配过程。
复用后总的序列长度是72 ∙ �CCE比特,每个 DCI 的速率匹配输出在其中占用连续的一段,长度由该 DCI 的 PDCCH 格式决定,起始位置必须位于由 RNTI 决定的若干搜索空间内,具体位置由层2 调度器决定并通知层 1。不同 DCI 在复用后序列中的位置不会重叠,但可能有未使用的 CCE 夹杂其间。协议定义未使用位置上的序列元素等于,实际系统在这些位置处发射 0 信号。图 4给出了一个复用的例子。各 DCI 在复用后序列中的位置顺序和层 2 下发的 DCI 顺序可以不一致。
随后各步骤对整个复用后序列进行操作。加扰步骤使用的扰码序列的初始状态为。层映射/预编码步骤使用发射分集。RE 映射步骤在每个天线端口上分别执行(对多个天线端口,映射关系总是一样的,但待发射的预编码后的星座点符号序列不同),具体地,把星座点符号序列中每连续 4 个元素组成一个四元组,称为 quad,以 quad 为单元执行子块交织(等同于 CC 速率匹配中的子块交织,只是以 quad,而非比特为操作单位),然后执行先符号、再子载波的二维扫描,把子块交织后的 quad 序列依次映射到扫描到的空闲(没有被 PCFICH 或PHICH 占用的)REG 中。 PDCCH 的 CRC 添加、信道编码、速率匹配步骤参见[2]的 5.3.3.2 至 5.3.3.4 节,其它步骤参见[1]的 6.8 节。 3、KeyStone 实现方案与负载测量 |







