WIP. Support numba udf for SChunks

martaiborra · martaiborra · commit d5c0993c2134 · 2024-04-15T10:35:28.000+02:00
diff --git a/blosc2/__init__.py b/blosc2/__init__.py
@@ -205,7 +205,7 @@ class Tuner(Enum):
     abs,
 )
 
-from .lazyexpr import LazyExpr
+from .lazyexpr import LazyExpr, expr_from_udf
 
 from .schunk import SChunk, open
 from .version import __version__
diff --git a/blosc2/blosc2_ext.pyx b/blosc2/blosc2_ext.pyx
@@ -1453,6 +1453,36 @@ cdef class SChunk:
         if self.schunk.cctx == NULL:
             raise RuntimeError("Could not create compression context")
 
+
+    def _set_aux_numba(self, func, inputs_id, dtype_output):
+        if self.schunk.storage.cparams.nthreads > 1:
+            raise AttributeError("compress `nthreads` must be 1 when assigning a prefilter")
+
+        func_id = func.__name__
+        blosc2.prefilter_funcs[func_id] = func
+        func_id = func_id.encode("utf-8") if isinstance(func_id, str) else func_id
+
+        # Set prefilter
+        cdef blosc2_cparams* cparams = self.schunk.storage.cparams
+        cparams.prefilter = <blosc2_prefilter_fn> general_numba
+
+        cdef blosc2_prefilter_params* preparams = <blosc2_prefilter_params *> malloc(sizeof(blosc2_prefilter_params))
+        cdef filler_udata* fill_udata = <filler_udata *> malloc(sizeof(filler_udata))
+        fill_udata.py_func = <char *> malloc(strlen(func_id) + 1)
+        strcpy(fill_udata.py_func, func_id)
+        fill_udata.inputs_id = inputs_id
+        fill_udata.output_cdtype = np.dtype(dtype_output).num
+        fill_udata.chunkshape = self.schunk.chunksize // self.schunk.typesize
+
+        preparams.user_data = fill_udata
+        cparams.preparams = preparams
+        _check_cparams(cparams)
+
+        blosc2_free_ctx(self.schunk.cctx)
+        self.schunk.cctx = blosc2_create_cctx(dereference(cparams))
+        if self.schunk.cctx == NULL:
+            raise RuntimeError("Could not create compression context")
+
     def _set_prefilter(self, func, dtype_input, dtype_output=None):
         if self.schunk.storage.cparams.nthreads > 1:
             raise AttributeError("compress `nthreads` must be 1 when assigning a prefilter")
@@ -1544,6 +1574,35 @@ cdef int general_filler(blosc2_prefilter_params *params):
 
     return 0
 
+
+cdef int general_numba(blosc2_prefilter_params *params):
+    cdef filler_udata *udata = <filler_udata *> params.user_data
+    cdef int nd = 1
+    cdef np.npy_intp dims = params.output_size // params.output_typesize
+
+    inputs_tuple = _ctypes.PyObj_FromPtr(udata.inputs_id)
+
+    output = np.PyArray_SimpleNewFromData(nd, &dims, udata.output_cdtype, <void*>params.output)
+    offset = params.nchunk * udata.chunkshape + params.output_offset // params.output_typesize
+
+    inputs = []
+    for obj, dtype in inputs_tuple:
+        if isinstance(obj, blosc2.SChunk):
+            out = np.empty(dims, dtype=dtype)
+            obj.get_slice(start=offset, stop=offset + dims, out=out)
+            inputs.append(out)
+        elif isinstance(obj, np.ndarray):
+            inputs.append(obj[offset : offset + dims])
+        elif isinstance(obj, (int, float, bool, complex)):
+            inputs.append(np.full(dims, obj, dtype=dtype))
+        else:
+            raise ValueError("Unsupported operand")
+
+    func_id = udata.py_func.decode("utf-8")
+    blosc2.prefilter_funcs[func_id](tuple(inputs), output, offset)
+
+    return 0
+
 def nelem_from_inputs(inputs_tuple, nelem=None):
     for obj, dtype in inputs_tuple:
         if isinstance(obj, blosc2.SChunk):
diff --git a/blosc2/lazyexpr.py b/blosc2/lazyexpr.py
@@ -507,3 +507,36 @@ def do_slices_intersect(slice1, slice2):
     np.testing.assert_allclose(res, nres)
     np.testing.assert_allclose(res2, nres)
     print("Everything is working fine")
+
+
+class NumbaExpr:
+    def __init__(self, func, inputs_tuple, schunk_dtype):
+        # Suposem que tots els operands tenen els mateix shape (ara per ara) i que són schunks, ja o
+        # canviarem més endavant
+        self.inputs_tuple = inputs_tuple  # Keep reference to evict lost reference
+        op1 = inputs_tuple[0][0]
+        cparams = {'typesize': np.dtype(schunk_dtype).itemsize, 'nthreads': 1}
+        self.nbytes = op1.size * cparams['typesize']
+        self.res = blosc2.SChunk(chunksize=self.nbytes, cparams=cparams)
+        self.res._set_aux_numba(func, id(inputs_tuple), schunk_dtype)
+        self.schunk_dtype = schunk_dtype  # Quan siga amb ndarray açò ja no caldrà
+        self.func = func
+
+    def eval(self):
+
+        chunksize = self.res.chunksize
+        written_nbytes = 0
+        while written_nbytes < self.nbytes:
+            chunk = np.zeros(chunksize // self.res.typesize, dtype=self.schunk_dtype)
+            self.res.append_data(chunk)
+            written_nbytes += chunksize
+            if (self.nbytes - written_nbytes) < self.res.chunksize:
+                chunksize = self.nbytes - written_nbytes
+
+        self.res.remove_prefilter(self.func.__name__)
+        return self.res
+
+
+# inputs_tuple = ( (operand, dtype), (operand2, dtype2), ... )
+def expr_from_udf(func, inputs_tuple, dtype):
+    return NumbaExpr(func, inputs_tuple, dtype)

Original file line number	Diff line number	Diff line change
`@@ -205,7 +205,7 @@ class Tuner(Enum):`
`205`	`205`	`abs,`
`206`	`206`	`)`
`207`	`207`
`208`		`-from .lazyexpr import LazyExpr`
	`208`	`+from .lazyexpr import LazyExpr, expr_from_udf`
`209`	`209`
`210`	`210`	`from .schunk import SChunk, open`
`211`	`211`	`from .version import __version__`