Self-supervised learning on tabular data: An investigation into different implementations of VIME
Det har varit svårt att missa uppsvinget av den allmänna tillgången till AI de senaste åren. Juridiken, arbetsmarknaden och industrin behöver alla anpassa sig fort för att hänga med. Med chattbotar och generativ AI som kan skapa en bild föreställande precis vad som helst på bara några minuter är det svårt att inte bli imponerad. I media har det uttryckts fascination men även en slags rädsla för huWith the objective to classify a tabular data set of breast cancer patients with a high accuracy the self- supervised model VIME [1] is studied. The influence of several hyperparameters during pre-training is investigated and AUC of the downstream task is regarded as the measurement of performance. A larger unlabeled synthetic data set is generated using the Synthetic Data Vault (SDV) [2]. Differe
