artiq/artiq/gateware/dsp/sawg.py

from collections import namedtuple

from migen import *
from misoc.interconnect.stream import Endpoint
from misoc.cores.cordic import Cordic

from .accu import PhasedAccu
from .tools import eqh, SatAddMixin
from .spline import Spline
from .fir import ParallelHBFUpsampler, halfgen4_cascade


_Widths = namedtuple("_Widths", "t a p f")
_Orders = namedtuple("_Orders", "a p f")


class SplineParallelDUC(Module):
    def __init__(self, widths, orders, parallelism=1, **kwargs):
        self.parallelism = parallelism
        self.widths = widths
        p = Spline(order=orders.p, width=widths.p)
        f = Spline(order=orders.f, width=widths.f)
        self.f = f.tri(widths.t)
        self.p = p.tri(widths.t)
        self.submodules += p, f
        self.ce = Signal(reset=1)
        self.clr = Signal()

        ###
        accu = PhasedAccu(len(self.f.a0), parallelism)
        cordic = [Cordic(width=widths.a, widthz=len(self.p.a0), guard=None,
                         eval_mode="pipelined") for i in range(parallelism)]
        self.submodules += accu, cordic

        self.xi = [c.xi for c in cordic]
        self.yi = [c.yi for c in cordic]
        self.xo = [c.xo for c in cordic]
        self.yo = [c.yo for c in cordic]
        self.latency = cordic[0].latency
        self.gain = cordic[0].gain
        self.f.latency += accu.latency + self.latency
        self.p.latency += accu.latency + self.latency

        ###

        assert p.latency == f.latency
        self.comb += [
            p.o.ack.eq(self.ce),
            f.o.ack.eq(self.ce),
            eqh(accu.i.f, f.o.a0),
            eqh(accu.i.p, p.o.a0),
            accu.i.stb.eq(p.o.stb | f.o.stb),
            accu.o.ack.eq(1),
            [eqh(c.zi, zi) for c, zi in
             zip(cordic, accu.o.payload.flatten())]
        ]

        assert p.latency == 1
        self.sync += [
            accu.i.clr.eq(0),
            If(p.i.stb,
                accu.i.clr.eq(self.clr),
            ),
        ]


class SplineParallelDDS(SplineParallelDUC):
    def __init__(self, widths, orders, **kwargs):
        a = Spline(order=orders.a, width=widths.a)
        self.a = a.tri(widths.t)
        self.submodules += a
        super().__init__(widths._replace(a=len(self.a.a0)), orders, **kwargs)

        self.a.latency += self.latency

        ###

        self.comb += [
            a.o.ack.eq(self.ce),
            [eqh(x, a.o.a0) for x in self.xi],
            [y.eq(0) for y in self.yi],
        ]


class Config(Module):
    def __init__(self, width):
        self.clr = Signal(3, reset=0b111)
        self.iq_en = Signal(2, reset=0b01)
        self.limits = [[Signal((width, True), reset=-(1 << width - 1)),
                       Signal((width, True), reset=(1 << width - 1) - 1)]
                      for i in range(3)]
        self.clipped = [Signal(2) for i in range(3)]  # TODO
        self.i = Endpoint([("addr", bits_for(4 + 2*len(self.limits))),
                           ("data", 16)])
        self.ce = Signal()

        ###

        div = Signal(16, reset=0)
        n = Signal.like(div)
        pad = Signal()

        reg = Array([Cat(div, n), self.clr, self.iq_en, pad] +
                    sum(self.limits, []))

        self.comb += [
            self.i.ack.eq(1),
            self.ce.eq(n == 0),
        ]
        self.sync += [
            n.eq(n - 1),
            If(self.ce,
                n.eq(div),
            ),
            If(self.i.stb,
                reg[self.i.addr].eq(self.i.data),
            ),
        ]


class Channel(Module, SatAddMixin):
    def __init__(self, width=16, parallelism=4, widths=None, orders=None):
        if orders is None:
            orders = _Orders(a=4, f=2, p=1)
        if widths is None:
            widths = _Widths(t=width, a=orders.a*width, p=orders.p*width,
                             f=(orders.f + 2)*width)

        self.submodules.a1 = a1 = SplineParallelDDS(widths, orders)
        self.submodules.a2 = a2 = SplineParallelDDS(widths, orders)
        coeff = halfgen4_cascade(parallelism, width=.4, order=8)
        hbf = [ParallelHBFUpsampler(coeff, width=width) for i in range(2)]
        self.submodules.b = b = SplineParallelDUC(
            widths._replace(a=len(hbf[0].o[0]), f=widths.f - width), orders,
            parallelism=parallelism)
        cfg = Config(widths.a)
        u = Spline(width=widths.a, order=orders.a)
        self.submodules += cfg, u, hbf
        self.u = u.tri(widths.t)
        self.i = [cfg.i, self.u, a1.a, a1.f, a1.p, a2.a, a2.f, a2.p, b.f, b.p]
        self.i_names = "cfg u a1 f1 p1 a2 f2 p2 f0 p0".split()
        self.i_named = dict(zip(self.i_names, self.i))
        self.y_in = [Signal((width, True)) for i in range(parallelism)]
        self.o = [Signal((width, True)) for i in range(parallelism)]
        self.widths = widths
        self.orders = orders
        self.parallelism = parallelism
        self.cordic_gain = a1.gain*b.gain

        self.u.latency += 1
        b.p.latency += 2
        b.f.latency += 2
        a_latency_delta = hbf[0].latency + b.latency + 2
        for a in a1, a2:
            a.a.latency += a_latency_delta
            a.p.latency += a_latency_delta
            a.f.latency += a_latency_delta

        self.latency = max(_.latency for _ in self.i[1:])
        for i in self.i[1:]:
            i.latency -= self.latency
            assert i.latency <= 0
        cfg.i.latency = 0

        ###

        self.comb += [
            a1.ce.eq(cfg.ce),
            a2.ce.eq(cfg.ce),
            b.ce.eq(cfg.ce),
            u.o.ack.eq(cfg.ce),
            Cat(a1.clr, a2.clr, b.clr).eq(cfg.clr),
            Cat(b.xi).eq(Cat(hbf[0].o)),
            Cat(b.yi).eq(Cat(hbf[1].o)),
        ]
        self.sync += [
            hbf[0].i.eq(self.sat_add(a1.xo[0], a2.xo[0],
                                     limits=cfg.limits[0],
                                     clipped=cfg.clipped[0])),
            hbf[1].i.eq(self.sat_add(a1.yo[0], a2.yo[0],
                                     limits=cfg.limits[1],
                                     clipped=cfg.clipped[1])),
        ]
        # wire up outputs and q_{i,o} exchange
        for o, x, y in zip(self.o, b.xo, self.y_in):
            self.sync += [
                o.eq(self.sat_add(
                    u.o.a0[-len(o):],
                    Mux(cfg.iq_en[0], x, 0),
                    Mux(cfg.iq_en[1], y, 0),
                    limits=cfg.limits[2],
                    clipped=cfg.clipped[2])),
            ]

    def connect_y(self, buddy):
        self.comb += Cat(buddy.y_in).eq(Cat(self.b.yo))