Lambda BER Schema

Approach	Pros	Cons
JSON Schema	Simple, widely adopted	Limited semantics, manual docs
OWL/RDF	Rich semantics	Complex, steep learning curve
Protocol Buffers	Fast serialization	Limited to specific languages
LinkML	Best of all worlds	Newer, smaller ecosystem

Core Class Hierarchy

Container Classes:

Dataset (root) → contains Study objects
Study → contains all experimental data

Entity Classes:

Sample, SamplePreparation
Instrument (+ subclasses for each technique)
ExperimentRun, WorkflowRun
DataFile, Image (+ specialized image types)

Supporting Classes:

MolecularComposition, BufferComposition
StorageConditions, ExperimentalConditions

Lambda BER Schema

Technical Deep Dive

Agenda

Part 1: LinkML Architecture

What is LinkML?

LinkML Metamodel

Why LinkML for Structural Biology?

LinkML vs Other Approaches

Part 2: Schema Structure

lambda-ber-schema Architecture

Core Class Hierarchy

Slot Definitions

Enumerations (Controlled Vocabularies)

Design Pattern: Inlined Collections

Design Pattern: Identifiers and References

Design Decision: Date/Time Handling

Design Decision: Scientific Notation

Part 3: Code Generation

The gen-project Command

What Gets Generated?

Generation Configuration

Python Dataclasses Example

Using Generated Python Classes

JSON Schema Validation

Auto-Generated Documentation

Part 4: Repository Structure

Directory Layout

Source Schema Location

Assets Directory

Test Data Organization

Documentation Structure

Part 5: Development Workflow

Setting Up Development Environment

The Development Cycle

Key justfile Targets

Schema Modification Example

Adding a New Class

Adding an Enumeration

Validation Rules

Creating Example Data

Part 6: Contributing

Contribution Workflow

What to Contribute

Best Practices for Schema Changes

Naming Conventions

Code Review Process

Semantic Versioning

Part 7: Testing and Validation

Testing Strategy

Schema Linting

Example Validation

Manual Validation

Python Testing

Type Checking

Continuous Integration

Part 8: Advanced Topics

Linking to External Ontologies

Units and Measurements

Mixins for Reusable Patterns

Slot Usage vs Definition

Conditional Validation Rules

Performance Considerations

Working with RDF/Linked Data

Schema Evolution Strategies

Custom Generators

Integration Patterns

Documentation Best Practices

Future LinkML Features

Resources and Community

Getting Help

Recap: Key Takeaways

Next Steps

Thank You!