# Importaciones de librerias
import numpy as np
import pandas as pd
import math, time, gc, re
from pathlib import Path
from IPython.display import display


# Semilla y parámetros base
rng = np.random.default_rng(286)
d = 8
grid  = [10**3, 10**4, 10**5]
dtype = np.float32


# Límites de memoria
MEM_BUDGET_MB   = 6000
A2_MEM_LIMIT_MB = 9000


A0_LOOPS_MAX_PAIRS   = 100_000_000
A1_ADAPT_MAX_PAIRS   = 100_000_000
A1_NAIVE_MAX_PAIRS   = 200_000_000
REPEAT_LARGE_THRESHOLD_PAIRS = 800_000_000


A2_FRAC_FREE = 0.60
A3_FRAC_FREE = 0.30
def ram_disponible_mb():
    try:
        import psutil
        return psutil.virtual_memory().available / 1e6
    except Exception:
        try:
            with open('/proc/meminfo') as f:
                txt = f.read()
            m = re.search(r"MemAvailable:\s+(\d+)\s+kB", txt)
            return (int(m.group(1))/1024.0) if m else None
        except Exception:
            return None
print('dtype =', np.dtype(dtype).name)
print('A2_MEM_LIMIT_MB =', A2_MEM_LIMIT_MB, '| MEM_BUDGET_MB =', MEM_BUDGET_MB)
avail = ram_disponible_mb()
print('RAM libre (estimada):', f"{avail:,.0f} MB" if avail else '¿N/D?')

dtype = float32
A2_MEM_LIMIT_MB = 9000 | MEM_BUDGET_MB = 6000
RAM libre (estimada): 11,836 MB


def mydot(u, x):
    s = 0.0
    for i in range(len(u)):
        s += float(u[i]) * float(x[i])
    return s
def getmaxdot(u, X):
    maxpos = 0
    maxdot = mydot(u, X[:, 0])
    for j in range(1, X.shape[1]):
        dval = mydot(u, X[:, j])
        if dval > maxdot:
            maxpos = j
            maxdot = dval
    return maxpos, maxdot
def maxdot_loops(Q, X):
    d, m = Q.shape
    idx  = np.empty(m, dtype=np.int64)
    vals = np.empty(m, dtype=Q.dtype)
    for i in range(m):
        j, v = getmaxdot(Q[:, i], X)
        idx[i]  = j
        vals[i] = v
    return idx, vals


def maxdot_naive(Q, X):
    m = Q.shape[1]
    idx = np.empty(m, dtype=np.int64)
    val = np.empty(m, dtype=Q.dtype)
    for i in range(m):
        s = Q[:, i].T @ X
        j = np.argmax(s)
        idx[i], val[i] = j, s[j]
    return idx, val
def getmaxdot_many(Q, X):
    m = Q.shape[1]
    idx = np.empty(m, dtype=np.int64)
    val = np.empty(m, dtype=Q.dtype)
    for i in range(m):
        s = Q[:, i].T @ X
        j = np.argmax(s)
        idx[i], val[i] = j, s[j]
    return idx, val


def maxdot_full(Q, X):
    S = Q.T @ X
    idx = np.argmax(S, axis=1)
    val = S[np.arange(S.shape[0]), idx]
    return idx, val


def safe_batch(n, dtype=np.float32, mem_budget_mb=1000):
    bytes_per = bytes_per_dtype(dtype)
    max_batch = int(max(1, (mem_budget_mb*1_000_000)//(n*bytes_per)))
    return max(1, max_batch)
def maxdot_batched(Q, X, batch=1000):
    m = Q.shape[1]
    idx = np.empty(m, dtype=np.int64)
    val = np.full(m, -np.inf, dtype=Q.dtype)
    for i0 in range(0, m, batch):
        i1 = min(i0 + batch, m)
        Sb = Q[:, i0:i1].T @ X   # (bi, n)
        ib = np.argmax(Sb, axis=1)
        vb = Sb[np.arange(Sb.shape[0]), ib]
        idx[i0:i1], val[i0:i1] = ib, vb
    return idx, val


def repeats_for(m, n):
    return 1 if (m*n) >= REPEAT_LARGE_THRESHOLD_PAIRS else 2
def evaluate_case(d, m, n, dtype=np.float32, run_A1=True):
    Q = make_matrix(d, m, dtype=dtype)
    X = make_matrix(d, n, dtype=dtype)
    flop_per_pair = 2*d - 1
    flops_total   = int(flop_per_pair * m * n)
    results = []
    # A0-loops
    if m*n <= A0_LOOPS_MAX_PAIRS:
        t = bench(maxdot_loops, Q, X, repeat=1)   # repeat=1 para no tardar
        results.append(("A0-loops", t, 0, flops_total))
    else:
        results.append(("A0-loops", None, 0, flops_total))
    # A1-naive
    if run_A1 and (m*n <= A1_NAIVE_MAX_PAIRS):
        t = bench(maxdot_naive, Q, X, repeat=repeats_for(m, n))
        results.append(("A1-naive", t, 0, flops_total))
    else:
        results.append(("A1-naive", None, 0, flops_total))
    # A1-adapt
    if run_A1 and (m*n <= A1_ADAPT_MAX_PAIRS):
        t = bench(getmaxdot_many, Q, X, repeat=1)
        results.append(("A1-adapt", t, 0, flops_total))
    else:
        results.append(("A1-adapt", None, 0, flops_total))
    # A2-full
    bytes_per = bytes_per_dtype(dtype)
    S_bytes   = m * n * bytes_per
    avail     = ram_disponible_mb()
    a2_ok = (A2_MEM_LIMIT_MB > 0) and (S_bytes <= A2_MEM_LIMIT_MB * 1e6)
    if avail is not None:
        a2_ok &= (S_bytes <= A2_FRAC_FREE * avail * 1e6)
    if a2_ok:
        t = bench(maxdot_full, Q, X, repeat=repeats_for(m, n))
        results.append(("A2-full", t, S_bytes, flops_total))
    else:
        results.append(("A2-full", None, S_bytes, flops_total))
    # A3-batched
    budget_mb = MEM_BUDGET_MB
    if avail is not None:
        budget_mb = min(MEM_BUDGET_MB, int(A3_FRAC_FREE * avail))
    b_calc = safe_batch(n, dtype=dtype, mem_budget_mb=budget_mb)
    b = min(m, b_calc)
    t = bench(maxdot_batched, Q, X, repeat=repeats_for(m, n), batch=b)
    batch_bytes = b * n * bytes_per
    results.append(("A3-batched", t, batch_bytes, flops_total))
    del Q, X
    gc.collect()
    return results


def bytes_per_dtype(dtype):
  return np.dtype(dtype).itemsize
# Verificación
combos = [(m, n) for m in grid for n in grid]
dfc = pd.DataFrame(combos, columns=['m','n'])
dfc['m·n'] = dfc['m'] * dfc['n']
bytes_per = bytes_per_dtype(dtype)
dfc['≈ mem(S) MB'] = (dfc['m·n'] * bytes_per) / 1e6
dfc['A2 cabe?']    = dfc['≈ mem(S) MB'] <= A2_MEM_LIMIT_MB
batch_calc = (MEM_BUDGET_MB*1_000_000)//(dfc['n']*bytes_per)
dfc['batch_A3']   = batch_calc.clip(lower=1).astype(int)
dfc['pico_A3 MB'] = (dfc['batch_A3']*dfc['n']*bytes_per)/1e6
dfc['pasadas_A3'] = np.ceil(dfc['m']/dfc['batch_A3']).astype(int)
display(dfc.style.hide(axis='index').format({'m':'{:,}','n':'{:,}','m·n':'{:,}',
                                             '≈ mem(S) MB':'{:,.1f}','pico_A3 MB':'{:,.1f}'}))


# 6) Ejecutar grid y tabla final
rows = []
for m in grid:
    for n in grid:
        res = evaluate_case(d, m, n, dtype=dtype, run_A1=True)
        for name, t, mem_peak, flops in res:
            batch_used = None
            if name == 'A3-batched' and mem_peak is not None:
                batch_used = int(mem_peak // (bytes_per_dtype(dtype)*n))
            rows.append(dict(
                d=d, m=m, n=n, algo=name,
                time_s=None if t is None else round(t, 4),
                mem_MB=None if mem_peak is None else round(mem_peak/1e6, 1),
                flops=flops,
                batch_used=batch_used
            ))

df = pd.DataFrame(rows).sort_values(['m','n','algo']).reset_index(drop=True)
display(df.style.hide(axis='index').format({'m':'{:,}','n':'{:,}','time_s':'{:.4f}','mem_MB':'{:,.1f}'}))

CSV guardado en: /content/resultados_grid.csv

m	n	m·n	≈ mem(S) MB	A2 cabe?	batch_A3	pico_A3 MB	pasadas_A3
1,000	1,000	1,000,000	4.0	True	1500000	6,000.0	1
1,000	10,000	10,000,000	40.0	True	150000	6,000.0	1
1,000	100,000	100,000,000	400.0	True	15000	6,000.0	1
10,000	1,000	10,000,000	40.0	True	1500000	6,000.0	1
10,000	10,000	100,000,000	400.0	True	150000	6,000.0	1
10,000	100,000	1,000,000,000	4,000.0	True	15000	6,000.0	1
100,000	1,000	100,000,000	400.0	True	1500000	6,000.0	1
100,000	10,000	1,000,000,000	4,000.0	True	150000	6,000.0	1
100,000	100,000	10,000,000,000	40,000.0	False	15000	6,000.0	7

d	m	n	algo	time_s	mem_MB	flops	batch_used
8	1,000	1,000	A0-loops	3.6430	0.0	15000000	nan
8	1,000	1,000	A1-adapt	0.0108	0.0	15000000	nan
8	1,000	1,000	A1-naive	0.0103	0.0	15000000	nan
8	1,000	1,000	A2-full	0.0080	4.0	15000000	nan
8	1,000	1,000	A3-batched	0.0080	4.0	15000000	1000.000000
8	1,000	10,000	A0-loops	30.5203	0.0	150000000	nan
8	1,000	10,000	A1-adapt	0.0156	0.0	150000000	nan
8	1,000	10,000	A1-naive	0.0157	0.0	150000000	nan
8	1,000	10,000	A2-full	0.0232	40.0	150000000	nan
8	1,000	10,000	A3-batched	0.0228	40.0	150000000	1000.000000
8	1,000	100,000	A0-loops	309.6573	0.0	1500000000	nan
8	1,000	100,000	A1-adapt	0.2131	0.0	1500000000	nan
8	1,000	100,000	A1-naive	0.2232	0.0	1500000000	nan
8	1,000	100,000	A2-full	0.2255	400.0	1500000000	nan
8	1,000	100,000	A3-batched	0.2392	400.0	1500000000	1000.000000
8	10,000	1,000	A0-loops	31.2270	0.0	150000000	nan
8	10,000	1,000	A1-adapt	0.0659	0.0	150000000	nan
8	10,000	1,000	A1-naive	0.0656	0.0	150000000	nan
8	10,000	1,000	A2-full	0.0313	40.0	150000000	nan
8	10,000	1,000	A3-batched	0.0273	40.0	150000000	10000.000000
8	10,000	10,000	A0-loops	303.9815	0.0	1500000000	nan
8	10,000	10,000	A1-adapt	0.1531	0.0	1500000000	nan
8	10,000	10,000	A1-naive	0.1593	0.0	1500000000	nan
8	10,000	10,000	A2-full	0.2378	400.0	1500000000	nan
8	10,000	10,000	A3-batched	0.2480	400.0	1500000000	10000.000000
8	10,000	100,000	A0-loops	nan	0.0	15000000000	nan
8	10,000	100,000	A1-adapt	nan	0.0	15000000000	nan
8	10,000	100,000	A1-naive	nan	0.0	15000000000	nan
8	10,000	100,000	A2-full	2.2268	4,000.0	15000000000	nan
8	10,000	100,000	A3-batched	2.8201	3,616.0	15000000000	9040.000000
8	100,000	1,000	A0-loops	305.4651	0.0	1500000000	nan
8	100,000	1,000	A1-adapt	0.7604	0.0	1500000000	nan
8	100,000	1,000	A1-naive	0.6800	0.0	1500000000	nan
8	100,000	1,000	A2-full	0.2496	400.0	1500000000	nan
8	100,000	1,000	A3-batched	0.2511	400.0	1500000000	100000.000000
8	100,000	10,000	A0-loops	nan	0.0	15000000000	nan
8	100,000	10,000	A1-adapt	nan	0.0	15000000000	nan
8	100,000	10,000	A1-naive	nan	0.0	15000000000	nan
8	100,000	10,000	A2-full	2.7096	4,000.0	15000000000	nan
8	100,000	10,000	A3-batched	2.2759	3,599.0	15000000000	89975.000000
8	100,000	100,000	A0-loops	nan	0.0	150000000000	nan
8	100,000	100,000	A1-adapt	nan	0.0	150000000000	nan
8	100,000	100,000	A1-naive	nan	0.0	150000000000	nan
8	100,000	100,000	A2-full	nan	40,000.0	150000000000	nan
8	100,000	100,000	A3-batched	23.3785	3,600.0	150000000000	9000.000000

PRÁCTICA 2A: REPORTE ESCRITO. EXPERIMENTOS Y ANÁLISIS DE ESTRUCTURAS DE DATOS¶

Introducción¶

Limitaciones¶

Importaciones y parámetros¶

Algoritmos¶

Evaluación¶

Verificación de combinaciones y memoria estimada¶

Ejecución del grid¶

Interpretación de la tabla¶

n = 1 000¶

n = 10 000¶

n = 100 000¶

Conclusión¶

Bibliografía¶