Update UsageNotes_Potency.md

f294217 verified 18 days ago

1.43 kB

python3 potency_inference.py 
<prompted for options>

Required Inputs

Required columns:

ligand_smiles (or SMILES, smiles, canonical_smiles) - Chemical structure in SMILES format
protein_sequence (or PROTEIN_SEQ, protein_seq, sequence) - Amino acid sequence

Optional:

pIC50 (or pic50, PIC50) - Ground truth binding affinity values (enables metric calculation)

XGBoost model (.json or .pkl) - Trained gradient boosting model
Feature scaler (.pkl) - StandardScaler for descriptor normalization
Descriptor list (.txt) - Names of RDKit molecular descriptors
Docking scores CSV (optional) - Pre-computed docking scores
- Columns: ligand_smiles, protein_sequence, docking_score

Generated Outputs

Output Directory Structure:

predictions/ (or custom name)
├── test_predictions.csv
├── metrics.json
├── config.json
└── predictions_plot.png