WIP - [artiq] Test

This commit is contained in:
David Mak 2024-08-15 04:08:46 +08:00
parent b3d86f7187
commit dddf10c41d
1 changed files with 172 additions and 152 deletions

View File

@ -41,7 +41,6 @@ use std::{
mem, mem,
sync::Arc, sync::Arc,
}; };
use inkwell::values::IntValue;
/// The parallelism mode within a block. /// The parallelism mode within a block.
#[derive(Copy, Clone, Eq, PartialEq)] #[derive(Copy, Clone, Eq, PartialEq)]
@ -568,157 +567,178 @@ fn format_rpc_ret<'ctx>(
let llvm_ret_ty = ctx.get_llvm_abi_type(generator, ret_ty); let llvm_ret_ty = ctx.get_llvm_abi_type(generator, ret_ty);
let result = match &*ctx.unifier.get_ty_immutable(ret_ty) { let result = match &*ctx.unifier.get_ty_immutable(ret_ty) {
// TypeEnum::TObj { obj_id, .. } if *obj_id == PrimDef::NDArray.id() => { TypeEnum::TObj { obj_id, .. } if *obj_id == PrimDef::NDArray.id() => {
// let llvm_i1 = ctx.ctx.bool_type(); let llvm_i1 = ctx.ctx.bool_type();
// let llvm_usize = generator.get_size_type(ctx.ctx); let llvm_usize = generator.get_size_type(ctx.ctx);
//
// let slot = ctx.builder.build_alloca(llvm_ret_ty, "rpc.ret.slot").unwrap(); let (elem_ty, ndims) = unpack_ndarray_var_tys(&mut ctx.unifier, ret_ty);
// let (elem_ty, ndims) = unpack_ndarray_var_tys(&mut ctx.unifier, ret_ty); let llvm_elem_ty = ctx.get_llvm_type(generator, elem_ty);
// let llvm_ret_ty = let llvm_ret_ty = NDArrayType::new(generator, ctx.ctx, llvm_elem_ty);
// NDArrayType::new(generator, ctx.ctx, ctx.get_llvm_type(generator, elem_ty)); let ndarray = llvm_ret_ty.new_value(generator, ctx, Some("rpc.result"));
// let ndarray = llvm_ret_ty.new_value(generator, ctx, None);
// ctx.builder.build_store(slot, ndarray.as_base_value()).unwrap(); let ndims =
// if let TypeEnum::TLiteral { values, .. } = &*ctx.unifier.get_ty_immutable(ndims) {
// let ndims = assert_eq!(values.len(), 1);
// if let TypeEnum::TLiteral { values, .. } = &*ctx.unifier.get_ty_immutable(ndims) {
// assert_eq!(values.len(), 1); u64::try_from(values[0].clone()).unwrap()
// } else {
// u64::try_from(values[0].clone()).unwrap() unreachable!();
// } else { };
// unreachable!(); ndarray.store_ndims(ctx, generator, llvm_usize.const_int(ndims, false));
// }; ndarray.create_dim_sizes(ctx, llvm_usize, ndarray.load_ndims(ctx));
// ndarray.store_ndims(ctx, generator, llvm_usize.const_int(ndims, false));
// ndarray.create_dim_sizes(ctx, llvm_usize, ndarray.load_ndims(ctx)); let llvm_usize_sizeof = ctx
// .builder
// let llvm_usize_sizeof = ctx .build_int_truncate_or_bit_cast(llvm_ret_ty.size_type().size_of(), llvm_usize, "")
// .builder .unwrap();
// .build_int_truncate_or_bit_cast(llvm_ret_ty.size_type().size_of(), llvm_usize, "") let llvm_pdata_sizeof = ctx
// .unwrap(); .builder
// let llvm_pdata_sizeof = ctx .build_int_truncate_or_bit_cast(
// .builder llvm_ret_ty.element_type().size_of().unwrap(),
// .build_int_truncate_or_bit_cast( llvm_usize,
// llvm_ret_ty.element_type().size_of().unwrap(), "",
// llvm_usize, )
// "", .unwrap();
// )
// .unwrap(); let dims_buf_sz =
// ctx.builder.build_int_mul(ndarray.load_ndims(ctx), llvm_usize_sizeof, "").unwrap();
// let dims_buf_sz =
// ctx.builder.build_int_mul(ndarray.load_ndims(ctx), llvm_usize_sizeof, "").unwrap(); let buffer_size =
// ctx.builder.build_int_add(dims_buf_sz, llvm_pdata_sizeof, "").unwrap();
// let buffer_size = let buffer_size = ctx.builder.build_left_shift(
// ctx.builder.build_int_add(dims_buf_sz, llvm_pdata_sizeof, "").unwrap(); ctx.builder.build_int_add(
// let buffer_size = ctx.builder.build_left_shift( ctx.builder.build_right_shift(
// ctx.builder.build_int_add( buffer_size,
// ctx.builder.build_right_shift( llvm_usize.const_int(2, false),
// buffer_size, false,
// llvm_usize.const_int(2, false), "",
// false, ).unwrap(),
// "", llvm_usize.const_int(1, false),
// ).unwrap(), "",
// llvm_usize.const_int(1, false), ).unwrap(),
// "", llvm_usize.const_int(2, false),
// ).unwrap(), "",
// llvm_usize.const_int(2, false), ).unwrap();
// "",
// ).unwrap(); let buffer =
// ctx.builder.build_array_alloca(llvm_i8, buffer_size, "rpc.buffer").unwrap();
// let buffer = let buffer = ArraySliceValue::from_ptr_val(buffer, buffer_size, Some("rpc.buffer"));
// ctx.builder.build_array_alloca(llvm_i8, buffer_size, "rpc.buffer").unwrap();
// let buffer = ArraySliceValue::from_ptr_val(buffer, buffer_size, Some("rpc.buffer")); let i_addr = ctx.builder.build_alloca(llvm_usize, "i.addr").unwrap();
// ctx.builder.build_unconditional_branch(head_bb).unwrap();
// let i_addr = ctx.builder.build_alloca(llvm_usize, "i.addr").unwrap();
// ctx.builder.build_unconditional_branch(head_bb).unwrap(); ctx.builder.position_at_end(head_bb);
// let phi = ctx.builder.build_phi(llvm_pi8, "rpc.ptr").unwrap();
// ctx.builder.position_at_end(head_bb); phi.add_incoming(&[(&buffer.base_ptr(ctx, generator), prehead_bb)]);
// let phi = ctx.builder.build_phi(llvm_pi8, "rpc.ptr").unwrap(); let alloc_size = ctx
// phi.add_incoming(&[(&buffer.base_ptr(ctx, generator), prehead_bb)]); .build_call_or_invoke(rpc_recv, &[phi.as_basic_value()], "rpc.size.next")
// let alloc_size = ctx .map(BasicValueEnum::into_int_value)
// .build_call_or_invoke(rpc_recv, &[phi.as_basic_value()], "rpc.size.next") .unwrap();
// .map(BasicValueEnum::into_int_value)
// .unwrap(); // Parse metadata block(s) for ndarrays
// gen_if_callback(
// // Parse metadata block(s) for ndarrays generator,
// gen_if_callback( ctx,
// generator, |_, ctx| {
// ctx, let i = ctx
// |_, ctx| { .builder
// let i = ctx .build_load(i_addr, "")
// .builder .map(BasicValueEnum::into_int_value)
// .build_load(i_addr, "") .unwrap();
// .map(BasicValueEnum::into_int_value)
// .unwrap(); Ok(ctx
// .builder
// Ok(ctx .build_int_compare(IntPredicate::EQ, i, llvm_usize.const_zero(), "")
// .builder .unwrap())
// .build_int_compare(IntPredicate::EQ, i, llvm_usize.const_zero(), "") },
// .unwrap()) |generator, ctx| {
// }, // let ppdata =
// |generator, ctx| { // generator.gen_var_alloc(ctx, llvm_ret_ty.element_type(), None).unwrap();
// let ppdata = // ctx.builder
// generator.gen_var_alloc(ctx, llvm_ret_ty.element_type(), None).unwrap(); // .build_store(ppdata, ndarray.data().base_ptr(ctx, generator))
// ctx.builder // .unwrap();
// .build_store(ppdata, ndarray.data().base_ptr(ctx, generator)) // call_memcpy_generic(
// .unwrap(); // ctx,
// call_memcpy_generic( // ppdata,
// ctx, // buffer.base_ptr(ctx, generator),
// ppdata, // llvm_pdata_sizeof,
// buffer.base_ptr(ctx, generator), // llvm_i1.const_zero(),
// llvm_pdata_sizeof, // );
// llvm_i1.const_zero(),
// ); // let pbuffer_dims_begin = unsafe {
// // buffer.ptr_offset_unchecked(ctx, generator, &llvm_pdata_sizeof, None)
// let pbuffer_dims_begin = unsafe { // };
// buffer.ptr_offset_unchecked(ctx, generator, &llvm_pdata_sizeof, None) // call_memcpy_generic(
// }; // ctx,
// call_memcpy_generic( // ndarray.dim_sizes().base_ptr(ctx, generator),
// ctx, // pbuffer_dims_begin,
// ndarray.dim_sizes().base_ptr(ctx, generator), // dims_buf_sz,
// pbuffer_dims_begin, // llvm_i1.const_zero(),
// dims_buf_sz, // );
// llvm_i1.const_zero(),
// ); // unsafe {
// // ndarray.dim_sizes().set_typed_unchecked(
// Ok(()) // ctx,
// }, // generator,
// |_, _| Ok(()), // &llvm_usize.const_zero(),
// ) // llvm_usize.const_int(3, false),
// .unwrap(); // );
// // }
// let is_done = ctx
// .builder call_memcpy_generic(
// .build_int_compare(IntPredicate::EQ, llvm_i32.const_zero(), alloc_size, "rpc.done") ctx,
// .unwrap(); ndarray.dim_sizes().base_ptr(ctx, generator),
// buffer.base_ptr(ctx, generator),
// ctx.builder.build_conditional_branch(is_done, tail_bb, alloc_bb).unwrap(); dims_buf_sz,
// ctx.builder.position_at_end(alloc_bb); llvm_i1.const_zero(),
// );
// let alloc_size = ctx.builder.build_left_shift(
// ctx.builder.build_int_add( ndarray.create_data(
// ctx.builder.build_right_shift( ctx,
// alloc_size, llvm_elem_ty,
// llvm_usize.const_int(2, false), call_ndarray_calc_size(generator, ctx, &ndarray.dim_sizes(), (None, None)),
// false, );
// "",
// ).unwrap(), Ok(())
// llvm_usize.const_int(1, false), },
// "", |_, _| Ok(()),
// ).unwrap(), )
// llvm_usize.const_int(2, false), .unwrap();
// "",
// ).unwrap(); let is_done = ctx
// let alloc_ptr = .builder
// ctx.builder.build_array_alloca(llvm_i8, alloc_size, "rpc.alloc").unwrap(); .build_int_compare(IntPredicate::EQ, llvm_i32.const_zero(), alloc_size, "rpc.done")
// phi.add_incoming(&[(&alloc_ptr, alloc_bb)]); .unwrap();
// let i =
// ctx.builder.build_load(i_addr, "i").map(BasicValueEnum::into_int_value).unwrap(); ctx.builder.build_conditional_branch(is_done, tail_bb, alloc_bb).unwrap();
// let i = ctx.builder.build_int_add(i, llvm_usize.const_int(1, false), "").unwrap(); ctx.builder.position_at_end(alloc_bb);
// ctx.builder.build_store(i_addr, i).unwrap();
// ctx.builder.build_unconditional_branch(head_bb).unwrap(); let alloc_size = ctx.builder.build_left_shift(
// ctx.builder.build_int_add(
// ctx.builder.position_at_end(tail_bb); ctx.builder.build_right_shift(
// ctx.builder.build_load(slot, "rpc.result").unwrap() alloc_size,
// } llvm_usize.const_int(2, false),
false,
"",
).unwrap(),
llvm_usize.const_int(1, false),
"",
).unwrap(),
llvm_usize.const_int(2, false),
"",
).unwrap();
let alloc_ptr =
ctx.builder.build_array_alloca(llvm_i8, alloc_size, "rpc.alloc").unwrap();
phi.add_incoming(&[(&alloc_ptr, alloc_bb)]);
let i =
ctx.builder.build_load(i_addr, "i").map(BasicValueEnum::into_int_value).unwrap();
let i = ctx.builder.build_int_add(i, llvm_usize.const_int(1, false), "").unwrap();
ctx.builder.build_store(i_addr, i).unwrap();
ctx.builder.build_unconditional_branch(head_bb).unwrap();
ctx.builder.position_at_end(tail_bb);
ndarray.as_base_value().into()
}
_ => { _ => {
let slot = ctx.builder.build_alloca(llvm_ret_ty, "rpc.ret.slot").unwrap(); let slot = ctx.builder.build_alloca(llvm_ret_ty, "rpc.ret.slot").unwrap();