--dir=FWD_D

# group_size = 4
# (1, 68, 56, 56)
--dt=f32 --tag=nchw --axis=2 --group=4 1x68x56x56
--dt=f32 --tag=nhwc --axis=2 --group=4 1x68x56x56

--dt=u8 --tag=nchw --axis=2 --group=4 1x68x56x56
--dt=u8 --tag=nhwc --axis=2 --group=4 1x68x56x56

--dt=s8 --tag=nchw --axis=2 --group=4 1x68x56x56
--dt=s8 --tag=nhwc --axis=2 --group=4 1x68x56x56

--dt=s32 --tag=nchw --axis=2 --group=4 1x68x56x56
--dt=s32 --tag=nhwc --axis=2 --group=4 1x68x56x56

# (1, 136, 56, 56)
--dt=f32 --tag=nchw --axis=2 --group=4 1x136x56x56
--dt=f32 --tag=nhwc --axis=2 --group=4 1x136x56x56
--dt=f32 --tag=nChw8c --axis=2 --group=4 1x136x56x56

--dt=u8 --tag=nchw --axis=2 --group=4 1x136x56x56
--dt=u8 --tag=nhwc --axis=2 --group=4 1x136x56x56
--dt=u8 --tag=nChw8c --axis=2 --group=4 1x136x56x56

--dt=s8 --tag=nchw --axis=2 --group=4 1x136x56x56
--dt=s8 --tag=nhwc --axis=2 --group=4 1x136x56x56
--dt=s8 --tag=nChw8c --axis=2 --group=4 1x136x56x56

--dt=s32 --tag=nchw --axis=2 --group=4 1x136x56x56
--dt=s32 --tag=nhwc --axis=2 --group=4 1x136x56x56
--dt=s32 --tag=nChw8c --axis=2 --group=4 1x136x56x56

# (1, 272, 56, 56)
--dt=f32 --tag=nchw --axis=2 --group=4 1x272x56x56
--dt=f32 --tag=nhwc --axis=2 --group=4 1x272x56x56
--dt=f32 --tag=nChw8c --axis=2 --group=4 1x272x56x56
--dt=f32 --tag=nChw16c --axis=2 --group=4 1x272x56x56

--dt=u8 --tag=nchw --axis=2 --group=4 1x272x56x56
--dt=u8 --tag=nhwc --axis=2 --group=4 1x272x56x56
--dt=u8 --tag=nChw8c --axis=2 --group=4 1x272x56x56
--dt=u8 --tag=nChw16c --axis=2 --group=4 1x272x56x56

--dt=s8 --tag=nchw --axis=2 --group=4 1x272x56x56
--dt=s8 --tag=nhwc --axis=2 --group=4 1x272x56x56
--dt=s8 --tag=nChw8c --axis=2 --group=4 1x272x56x56
--dt=s8 --tag=nChw16c --axis=2 --group=4 1x272x56x56

--dt=s32 --tag=nchw --axis=2 --group=4 1x272x56x56
--dt=s32 --tag=nhwc --axis=2 --group=4 1x272x56x56
--dt=s32 --tag=nChw8c --axis=2 --group=4 1x272x56x56
--dt=s32 --tag=nChw16c --axis=2 --group=4 1x272x56x56

# blocked with tail
--dt=f32 --tag=nChw16c --axis=1 --group=4 1x12x56x56
--dt=f32 --tag=nChw16c --axis=1 --group=4 1x24x56x56
--dt=f32 --tag=nChw16c --axis=1 --group=4 1x36x56x56
--dt=f32 --tag=nChw16c --axis=1 --group=4 1x68x56x56

# 3D (1, 272, 2, 56, 56)
--dt=f32 --tag=ncdhw --axis=3 --group=4 1x272x2x56x56
--dt=f32 --tag=ndhwc --axis=3 --group=4 1x272x2x56x56
--dt=f32 --tag=nCdhw8c --axis=3 --group=4 1x272x2x56x56
--dt=f32 --tag=nCdhw16c --axis=3 --group=4 1x272x2x56x56

--dt=u8 --tag=ncdhw --axis=3 --group=4 1x272x2x56x56
--dt=u8 --tag=ndhwc --axis=3 --group=4 1x272x2x56x56
--dt=u8 --tag=nCdhw8c --axis=4 --group=4 1x272x2x56x56
--dt=u8 --tag=nCdhw16c --axis=4 --group=4 1x272x2x56x56

--dt=s8 --tag=ncdhw --axis=3 --group=4 1x272x2x56x56
--dt=s8 --tag=ndhwc --axis=3 --group=4 1x272x2x56x56
--dt=s8 --tag=nCdhw8c --axis=4 --group=4 1x272x2x56x56
--dt=s8 --tag=nCdhw16c --axis=4 --group=4 1x272x2x56x56

--dt=s32 --tag=ncdhw --axis=3 --group=4 1x272x2x56x56
--dt=s32 --tag=ndhwc --axis=3 --group=4 1x272x2x56x56
--dt=s32 --tag=nCdhw8c --axis=4 --group=4 1x272x2x56x56
--dt=s32 --tag=nCdhw16c --axis=4 --group=4 1x272x2x56x56

--dir=BWD_D

--dt=f32 --tag=nchw --axis=2 --group=4 1x272x56x56
--dt=f32 --tag=nhwc --axis=2 --group=4 1x272x56x56
--dt=f32 --tag=nChw8c --axis=2 --group=4 1x272x56x56
--dt=f32 --tag=nChw16c --axis=2 --group=4 1x272x56x56

--dt=u8 --tag=nchw --axis=2 --group=4 1x272x56x56
--dt=u8 --tag=nhwc --axis=2 --group=4 1x272x56x56
--dt=u8 --tag=nChw8c --axis=2 --group=4 1x272x56x56
--dt=u8 --tag=nChw16c --axis=2 --group=4 1x272x56x56

--dt=s8 --tag=nchw --axis=2 --group=4 1x272x56x56
--dt=s8 --tag=nhwc --axis=2 --group=4 1x272x56x56
--dt=s8 --tag=nChw8c --axis=2 --group=4 1x272x56x56
--dt=s8 --tag=nChw16c --axis=2 --group=4 1x272x56x56

--dt=s32 --tag=nchw --axis=2 --group=4 1x272x56x56
--dt=s32 --tag=nhwc --axis=2 --group=4 1x272x56x56
--dt=s32 --tag=nChw8c --axis=2 --group=4 1x272x56x56
--dt=s32 --tag=nChw16c --axis=2 --group=4 1x272x56x56

