SetFit with mini1013/master_domain

This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

  1. Fine-tuning a Sentence Transformer with contrastive learning.
  2. Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Sources

Model Labels

Label Examples
6.0
  • '스위스유스트 노간주 크림 100ml 옵션없음 무한상사'
  • '퓨어라이트 아로니아베리 주름개선 크림 옵션없음 퓨어 리테일'
  • '내추럴더마 프로젝트 시카 바이오 플라센타 크림 50ml 1021828 시카 바이오 플라센타 크림 1개 앤디월드'
1.0
  • '네오팜 제로이드 인텐시브 로션 MD 200ml 옵션없음 옐로우로켓'
  • '[케이스훼손] 더 후 공진향 인양 로션 110ml (케이스훼손) 인양 로션. 주식회사 포러스'
  • '크리니크 드라마티컬리 디퍼런트 모이스처라이징 젤 125ml(건성, 중복합) 옵션없음 옐로우로켓'
10.0
  • '하다라보 고쿠쥰 2종 세트(신형) 옵션없음 오레오'
  • '코스트코 프리메라 오가니언스 베리어 리페어 2종 선물세트 옵션없음 하랑'
  • '인셀덤 더마톨로지 퍼스트패키지 EX 옵션없음 보니따 주식회사'
7.0
  • '스킨푸드 캐롯 카로틴 카밍 워터 패드 60매 당근패드 닦토 11203452 캐롯 카로틴 카밍 워터 패드 30매 리필 캐롯 카로틴 모이스트 이펙터 52ml 메이써니'
  • '스킨푸드 미나리 패드 토너 닥토 닦토 60매 옵션없음 찬이네마켓'
  • '[리얼베리어] 익스트림 판테놀 토너 패드 150ml(80매) 옵션없음 (주)네오팜'
4.0
  • 'Double Serum Eye 20ml 클라랑스 옵션없음 팬더샐러'
  • '가히 아이밤 9g 옵션없음 엠컴퍼니'
  • '마티나겝하르트 아보카도 아이크림 15ml [공식수입원] 옵션없음 (주)그레이스클럽'
9.0
  • '스킨아이 유기농 티트리 오일 옵션없음 폴슨 주식회사(FOLSN Inc.)'
  • '티트리 오일 10ML_리뉴얼 옵션없음 (주)씨제이이엔엠'
  • '스킨아이 유기농 티트리 오일 10ml 옵션없음 다사다 유한책임회사'
0.0
  • '가로목주름 세로목주름 제거 목탄력 턱살크림 우주를 담아'
  • '[1+1] 목주름 다리미 넥스틱 펩타이드 리들 1000샷 탄력 리프팅 안티에이징 옵션없음 소중한 우리아기'
  • 'Sisley 시슬리 젠틀 브러쉬 포 페이스 앤 넥 1pcs 옵션없음 타임투글로벌'
8.0
  • 'AHC 누드톤업크림 내추럴글로우 40ml 옵션없음 가온'
  • '내추럴더마 프로젝트 비타민 B9 톤업 미백 크림 65ml 옵션없음 음파 유한책임회사'
  • '롬앤 백미 톤업 크림 세트 백미 크림 2개 이엘엠(ELM)'
2.0
  • '자트인사이트 울트라 셋팅 진짜 픽서 50ml 옵션없음 49행운스토어'
  • 'ECLADO NK-CX 프로틴 포텐 부스터 세포코팅 미스트 뿌리는 단백질 정품 에끌라두 NK-CX 프로틴 포텐 부스터 하이그래'
  • '최대 43% / 달바 옐로우 미스트 세럼 100mlX2개 [교차] 옐로우100ml+레드100ml 주식회사 달바글로벌'
3.0
  • '톤28 pH 균형제 토너 250ml × 1개 100ml x 2개 마켓 헤이데이'
  • '세레코 토리든 다이브인 저분자 히알루론산 토너 300ml(지성, 복합) 옵션없음 옐로우로켓'
  • '톤28 플러스마이너스 pH 균형제 (토너)250ml 옵션없음 퍼펙트픽스'
5.0
  • 'CHANEL 르 리프트 프로 컨센트레이트 컨투어 50 ml 하이그래'
  • '브링그린 알로에 99% 수딩 젤 300ml(민감성)/JL 옵션없음 주식회사 제이엘'
  • '[설화수] 윤조 에센스 6세대 90mlss 옵션없음 빈티지브릿지'

Evaluation

Metrics

Label Accuracy
all 0.7989

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_bt8_test")
# Run inference
preds = model("참존 탑클래스 리프팅 스킨 120ml 옵션없음 하루뷰티")

Training Details

Training Set Metrics

Training set Min Median Max
Word count 4 9.2179 23
Label Training Sample Count
0.0 18
1.0 18
2.0 22
3.0 20
4.0 32
5.0 30
6.0 40
7.0 23
8.0 17
9.0 14
10.0 23

Training Hyperparameters

  • batch_size: (512, 512)
  • num_epochs: (50, 50)
  • max_steps: -1
  • sampling_strategy: oversampling
  • num_iterations: 60
  • body_learning_rate: (2e-05, 1e-05)
  • head_learning_rate: 0.01
  • loss: CosineSimilarityLoss
  • distance_metric: cosine_distance
  • margin: 0.25
  • end_to_end: False
  • use_amp: False
  • warmup_proportion: 0.1
  • l2_weight: 0.01
  • seed: 42
  • eval_max_steps: -1
  • load_best_model_at_end: False

Training Results

Epoch Step Training Loss Validation Loss
0.0323 1 0.4874 -
1.6129 50 0.3751 -
3.2258 100 0.0862 -
4.8387 150 0.0251 -
6.4516 200 0.0101 -
8.0645 250 0.0042 -
9.6774 300 0.0045 -
11.2903 350 0.0044 -
12.9032 400 0.0041 -
14.5161 450 0.0043 -
16.1290 500 0.0042 -
17.7419 550 0.0042 -
19.3548 600 0.004 -
20.9677 650 0.0043 -
22.5806 700 0.0042 -
24.1935 750 0.004 -
25.8065 800 0.0004 -
27.4194 850 0.0001 -
29.0323 900 0.0001 -
30.6452 950 0.0001 -
32.2581 1000 0.0001 -
33.8710 1050 0.0001 -
35.4839 1100 0.0001 -
37.0968 1150 0.0001 -
38.7097 1200 0.0001 -
40.3226 1250 0.0001 -
41.9355 1300 0.0001 -
43.5484 1350 0.0001 -
45.1613 1400 0.0001 -
46.7742 1450 0.0001 -
48.3871 1500 0.0001 -
50.0 1550 0.0001 -

Framework Versions

  • Python: 3.10.12
  • SetFit: 1.1.0
  • Sentence Transformers: 3.3.1
  • Transformers: 4.44.2
  • PyTorch: 2.2.0a0+81ea7a4
  • Datasets: 3.2.0
  • Tokenizers: 0.19.1

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}
Downloads last month
16
Safetensors
Model size
111M params
Tensor type
F32
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Model tree for mini1013/master_cate_bt8_test

Base model

klue/roberta-base
Finetuned
(136)
this model

Evaluation results