SetFit with mini1013/master_domain

This is a SetFit model that can be used for Text Classification. This SetFit model uses mini1013/master_domain as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

Fine-tuning a Sentence Transformer with contrastive learning.
Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Type: SetFit
Sentence Transformer body: mini1013/master_domain
Classification head: a LogisticRegression instance
Maximum Sequence Length: 512 tokens
Number of Classes: 17 classes

Model Sources

Repository: SetFit on GitHub
Paper: Efficient Few-Shot Learning Without Prompts
Blogpost: SetFit: Efficient Few-Shot Learning Without Prompts

Model Labels

Label	Examples
5.0	'에잇데이즈 셀룰라이트 괄사 크림 팔뚝 종아리 허벅지 부유방 붓기 살 제거 빼기 옵션없음 인지트레이더' '약손명가 여리한 패치 일시적 셀룰라이트 뱃살 복부관리 바디라인 ★앵콜특가 3Box+5매입추가증정 주식회사 약손명가 헬스케어' '질 전용 건조 윤활제 윤활재 부부 비건 촉촉젤 관계개선 옵션없음 다원월드'
13.0	'스파토너 10kg 대용량입욕제 옵션없음 호른달' '아카로아 로즈 미니 밤 옵션없음 (주)올스프링랜드' '[현대백화점][사봉] 배쓰볼 파츌리라벤더바닐라 150g [00001] 단일상품 (주)현대홈쇼핑'
12.0	'피에이치포 팬톡 파우더 올리브영 여성청결제 밸런스톡 뿌리는 Y존 이너케어 질 유래 유산균 뿌리는 질유산균파우더 팬톡6.6g(2개월분) 지비비 주식회사 (GBB CO. LTD)' '비오텀 인팀 워시폼 여성청결제 (거품타입) 250ml 크랜베리 인팀 워시 폼 250ml 주식회사바이유럽' '이너수 질세정기 2개입X2박스(4개입) 질내 보습 삽입형 의료기기 질세정제 주사기타입 여성청결제 옵션없음 알리코제약(주)'
8.0	'씨큐라롬 젤 옵션없음 (주)에코앤네이쳐' '넛세린 시즌3 슈퍼 넛 너리싱 밤 100ml 촉촉함(수분공급), 부드러운 발림 저자극, 각질케어, 윤기부여, 흡수력, 어린이겸용 옵션없음 나뭉' '온열 스포츠 박찬호 크림_콜라보에디션 신태용 리커버리 크림 플러스 500ml+60ml(2mlx30ea) 옵션없음 주식회사 동지'
11.0	'도테라 자몽15ml 도테라오일 doterra 옵션없음 베르데몰' '나우푸드 유기농 오렌지 에센셜 오일 1온즈 옵션없음 CONNECTLAB INC' '도테라 오레가노터치 10ml 도테라오일 롤온 옵션없음 베르데몰'
1.0	'괌여행 사이판선물 괌기념품 민감성피부 플러스 노니비누 9+1세트 건성 복합성 옵션없음 킹피셔스노니' '도브 센서티브바 미국 106g 14개입 옵션없음 옐로우브릭로드' '웰바스 아이스크림솝 270g 옵션없음 (주)미르코스'
6.0	'[눅스] 윌 프로디쥬스 멀티 네롤리 오일 100ml 옵션없음 주식회사케이엔유' '[아베다] 쿨링 밸런싱 오일 50ml~한글택X 옵션없음 쉬즈 스토리' '도테라 코코넛오일 옵션없음 공감브레인 상담센터'
14.0	'셀프왁싱 대용량 제모하드왁스 크리스탈500g 옵션없음 주식회사 모컴퍼니' '이탈왁스 하드 너바나 아로마틱스파 라벤더1kg 옵션없음 파인뷰티' '생식기제모크림 엉덩이 가슴털 항문제모크림 옵션없음 다담꼬'
0.0	'크리스탈 미네랄 데오드란트 롤온 무향 66ml 옵션없음 비래유통' '[공식몰] 크리스탈 데오드란트 120g 무향 대용량 스틱 2EA 옵션없음 주식회사 미스코스' 'GBH 지비에이치 센티드 데오스틱 3종 택1 24g NEROLI MUSK 주식회사 지비에이치'
7.0	'베르뷔 고보습 대용량 퍼퓸 바디로션 & 워시 베르뷔' '[기획] 베스트셀러 3종 그린로즈 라지 세트 옵션없음 (주)비엔에프통상' 'nb도브여행용3종-B타입 1box50입 옵션없음 물빛나래상회'
3.0	'W5250F5U7 134ml 그린 샤워코롱 옵션없음 성진몰' '더프트앤도프트 바디 퍼퓸 미스트 80ml 베이비소피 주식회사 제너럴브랜즈' '조러브스 조 바이 조 러브스 배스 코롱 200ml 옵션없음 포비티엘'
15.0	'블루크로스 캘러스 32oz 946ml 발뒷꿈치 각질제거 각질연화 굳은살제거 32oz_비닐발커버 50매 백억언니' '히말라야 풋 케어 크림 75ml 옵션없음 스루치로 유한책임회사' '[1+1] 바렌 시어버터 슬리핑 뒤꿈치 보습 발각질 풋케어 힐 패치 1개 (10개입) (주)마르스랩스'
4.0	'아몬드 샤워 스크럽 200ml 옵션없음 플래너' '지오마 이몰리언트 바디스크럽 600g 1개 600g × 1개 600g x 1개 케이컴퍼니' '엄마의목욕탕레시피 바디필링패드 1매입 스트롱 주워 담다'
2.0	'쿤달 허니 앤 마카다미아 모이스처 퓨어 바디로션 베이비 파우더 500ml 옵션없음 굿우리' '암웨이 GH 너리쉬 400ml (23년 new) 최신정품 옵션없음 포유어뷰티' 'LOCCITANE 록시땅 [버베나 포켓솝 정품 ]시트러스 버베나 프레쉬 밀크 250ml 15LC250VA23 259557 옵션없음 냥냥홀릭'
9.0	'바이오가 등드름 바디워시 베타인살리실레이트 옵션없음 카프리' 'x 2개 바디워시 910g 베이비파우더 해피바스 1WDC1FFF7 옵션없음 플러스몰' '더바디샵 모링가 샤워젤 750ml(신형) 1개 옵션없음 디제이커머스(DJ커머스)'
16.0	'얼투아 PERFUME HAND CREAM WINTER ROSE 옵션없음 현대스타일' '아이깨끗해 프리미엄 클린 비건 폼 핸드솝 피오니향 450ml 1개 옵션없음 둘레푸드' 'Oz 아이깨끗해 순2종세트 옵션없음 온집안(onziban)'
10.0	'파우더/피부파우더/분칠/아기엉덩이 아기살접힌데 존슨즈 콘스타치 옵션없음 진소란총각네' '영국 우즈오브윈저 화이트 자스민 바디 파우더 100g / Woods of windsor 옵션없음 Hong Joo Ra' '파우더200g/ 존슨즈 땀띠 분칠 아기 엉덩이 콘스타치 존슨즈 콘스타치 파우더200g 후니후니003'

Evaluation

Metrics

Label	Accuracy
all	0.7189

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_bt3_test")
# Run inference
preds = model("아로마티카 퓨어 앤 소프트 여성청결제 170ml (폼타입) 옵션없음 포사도")

Training Details

Training Set Metrics

Training set	Min	Median	Max
Word count	3	9.3333	20

Label	Training Sample Count
0.0	22
1.0	20
2.0	20
3.0	12
4.0	21
5.0	18
6.0	23
7.0	15
8.0	20
9.0	20
10.0	11
11.0	15
12.0	20
13.0	23
14.0	21
15.0	22
16.0	21

Training Hyperparameters

batch_size: (512, 512)
num_epochs: (50, 50)
max_steps: -1
sampling_strategy: oversampling
num_iterations: 60
body_learning_rate: (2e-05, 1e-05)
head_learning_rate: 0.01
loss: CosineSimilarityLoss
distance_metric: cosine_distance
margin: 0.25
end_to_end: False
use_amp: False
warmup_proportion: 0.1
l2_weight: 0.01
seed: 42
eval_max_steps: -1
load_best_model_at_end: False

Training Results

Epoch	Step	Training Loss	Validation Loss
0.0263	1	0.5057	-
1.3158	50	0.423	-
2.6316	100	0.1568	-
3.9474	150	0.067	-
5.2632	200	0.0479	-
6.5789	250	0.0324	-
7.8947	300	0.0196	-
9.2105	350	0.0138	-
10.5263	400	0.0111	-
11.8421	450	0.0051	-
13.1579	500	0.0041	-
14.4737	550	0.0043	-
15.7895	600	0.0026	-
17.1053	650	0.0005	-
18.4211	700	0.0003	-
19.7368	750	0.0002	-
21.0526	800	0.0002	-
22.3684	850	0.0002	-
23.6842	900	0.0002	-
25.0	950	0.0002	-
26.3158	1000	0.0001	-
27.6316	1050	0.0001	-
28.9474	1100	0.0001	-
30.2632	1150	0.0001	-
31.5789	1200	0.0001	-
32.8947	1250	0.0001	-
34.2105	1300	0.0001	-
35.5263	1350	0.0001	-
36.8421	1400	0.0001	-
38.1579	1450	0.0001	-
39.4737	1500	0.0001	-
40.7895	1550	0.0001	-
42.1053	1600	0.0001	-
43.4211	1650	0.0001	-
44.7368	1700	0.0001	-
46.0526	1750	0.0001	-
47.3684	1800	0.0001	-
48.6842	1850	0.0001	-
50.0	1900	0.0001	-

Framework Versions

Python: 3.10.12
SetFit: 1.1.0
Sentence Transformers: 3.3.1
Transformers: 4.44.2
PyTorch: 2.2.0a0+81ea7a4
Datasets: 3.2.0
Tokenizers: 0.19.1

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}

mini1013
/

master_cate_bt3_test