Metric SAM3D Pipeline

Generates metric-scale, pose-registered 3D meshes from RGB-D images and object masks.

Installation

git submodule update --init --recursive
# Follow docs for: sam3d-objects, scenecomplete, foundationpose
bash setup_envs_properly.sh

# For auto-segmentation pipeline: Set OpenAI API key
export OPENAI_API_KEY="sk-..."  # Add to ~/.bashrc for persistence

If conda is not at /home/$USER/miniconda3, update LD_LIBRARY_PATH in metric_sam3d_pipeline.sh.

Usage

Standard Pipeline (with pre-computed masks)

./metric_sam3d_pipeline.sh [--device 0] <capture_folder> <output_folder>

Input Structure:

capture_folder/
├── rgb.png              # RGB image
├── depth.png            # 16-bit PNG, depth in millimeters
├── intrinsics.npy       # 3x3 camera matrix
└── masks/
    └── *.png            # White=object, black=background

Auto-Segmentation Pipeline (masks generated automatically)

Uses ChatGPT to identify objects and GroundedSAM to generate masks automatically:

./segmenting_metric_sam3d_pipeline.sh [--device 0] <capture_folder> <output_folder>

Input Structure:

capture_folder/
├── rgb.png              # RGB image
├── depth.png            # 16-bit PNG, depth in millimeters
└── intrinsics.npy       # 3x3 camera matrix
# No masks needed - generated automatically!

Requirements:

OPENAI_API_KEY environment variable must be set
GroundingDINO and SAM weights (auto-downloaded by setup_envs_properly.sh)

Note: SceneComplete/scenecomplete/scripts/python/segmentation/utils/segment_config.yaml uses absolute paths for GroundingDINO config and weights. If you move the repository or use a different username, update the paths in this file accordingly.

Output

Registered meshes: output_folder/results/completion_output/*.obj

API

# Start server (requires OPENAI_API_KEY for /metric_sam3d_full/ endpoint)
python metric_sam3d_api.py

Standard Endpoint (with pre-computed masks)

# Call (from any machine), takes roughly five minutes
curl -X POST "http://<ip>:8018/metric_sam3d/" \
    -F "capture_zip=@capture.zip" \
    -F "device=0" \
    --output result.zip

Requirements: ZIP must contain rgb.png, depth.png, intrinsics.npy, and masks/*.png

Auto-Segmentation Endpoint (masks generated automatically)

# Call (from any machine), takes longer due to auto-segmentation
curl -X POST "http://<ip>:8018/metric_sam3d_full/" \
    -F "capture_zip=@capture.zip" \
    -F "device=0" \
    --output result.zip

Requirements:

ZIP must contain only rgb.png, depth.png, intrinsics.npy (no masks needed!)
Server must have OPENAI_API_KEY environment variable set

Creating the ZIP (files at root, not nested):

cd my_capture && zip -r ../capture.zip .

Visualization

python visualization.py --folder <output_folder>

TODO

Compute masks with SAM3
Compute masks with GPT + SAM2/3 (implemented in segmenting_metric_sam3d_pipeline.sh)
"Cheap" endpoint using built-in pointmap

Name		Name	Last commit message	Last commit date
Latest commit History 22 Commits
SceneComplete @ c624155		SceneComplete @ c624155
__pycache__		__pycache__
sam-3d-objects @ ebb52d1		sam-3d-objects @ ebb52d1
.gitignore		.gitignore
.gitmodules		.gitmodules
CLAUDE.md		CLAUDE.md
README.md		README.md
generate_meshes.py		generate_meshes.py
metric_sam3d_api.py		metric_sam3d_api.py
metric_sam3d_pipeline.sh		metric_sam3d_pipeline.sh
prepare_data_for_registration.py		prepare_data_for_registration.py
segmenting_metric_sam3d_pipeline.sh		segmenting_metric_sam3d_pipeline.sh
setup_envs_properly.sh		setup_envs_properly.sh
visualization.py		visualization.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Metric SAM3D Pipeline

Installation

Usage

Standard Pipeline (with pre-computed masks)

Auto-Segmentation Pipeline (masks generated automatically)

Output

API

Standard Endpoint (with pre-computed masks)

Auto-Segmentation Endpoint (masks generated automatically)

Visualization

TODO

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

chsahit/metric_sam3d

Folders and files

Latest commit

History

Repository files navigation

Metric SAM3D Pipeline

Installation

Usage

Standard Pipeline (with pre-computed masks)

Auto-Segmentation Pipeline (masks generated automatically)

Output

API

Standard Endpoint (with pre-computed masks)

Auto-Segmentation Endpoint (masks generated automatically)

Visualization

TODO

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages