김한성 is a Research Assistant at PwC.
-
Research AssistantPwc Aug 2024 - Present대한민국 서울삼성전자 N-ERP 프로젝트에 참여하여 멀티턴 기반 ERP query문 작성 모듈을 담당했습니다. ERP 전문 용어 및 history 기반 요구사항을 반영하기 위해 프롬프팅 방법을 활용하여 문제를 해결했습니다.특히 고객사의 요구를 적절히 반영하기 위해 기존 시스템 숙지 및 담당 모듈 관련 리스크 및 개선사항을 정리하여 팀에 기여를 했습니다. 또한 API의 로직을 전반적으로 검수하여 refactoring 및 레거시 수정 등 지속적으로 기여하였습니다. 기존 시스템에 AI기반 서비스 개선 경험을 통해 도메인 이해를 기반으로 AI 모델을 설계하는 것의 중요성을 느끼게 되었습니다. -
연구원마음Ai Maum.Ai Jul 2024 - Aug 2024판교고용노동부 AI근로감독관 프로젝트에 참여하여 한국어 법률 특화 언어모델 개발을 담당했습니다. 자사 한국어 언어모델에서 법률 지식을 학습하기 위해 Continual Learning을 담당했습니다. 해당 과정에서 Catastropic forgetting과 Low adaptation 문제가 있어 이를 해결하기 위해 선행 연구를 참고하여 다음과 같은 전략을 취했습니다. 1. forgetting을 방지하기 위한 gradient magnitude‑based regularization2. 법률 adaptation 성능을 높이기 위해 logit swap을 통한 backward KL divergence3. replay-based forward KL divergence 전략해당 세가지를 auxiliary loss로 조합하여 언어모델의 adapting성능 향상 및 catastropic forgetting을 방지했습니다. 그 결과 vanilla continual learning 대비 한국어 및 한국어 법률 평균 7%의 성능 향상을 이뤘습니다. -
Undergraduate Student ResearcherSeoul National University Jan 2024 - Jun 2024Seoul, South Korea금융 도메인의 table numerical reasoning 연구에 참여하여 실험을 통해 기존 방법론이 갖는 2가지 편향에 대해 증명했습니다. jargon, table header에 대해 dependency가 있는 것을 실험을 통해 확인하고 이를 해결하기 위해 Numerical Reasoning utilizing Primitive Description(NRPD)를 제안하였습니다. NRPD는 Description이라는 보조 정보를 활용하여 query에 의존하던 언어모델에 description을 주어 reasoning 성능을 높이고 anonymization based self-supervised learning을 제안하여 dependency를 완하하는 결과를 보장했습니다. 해당 결과 기존 방법론 대비 program accuracy가 11%로 높은 성능 향상을 가져왔고 expert domain에 자주 등장하는 편향을 줄일 수 있는 가능성을 시사했습니다.이는 CKAIA2024에 ’Generalizing Numerical Reasoning in table data through utilization of PrimitiveDescriptions and self‐supervised learning‘라는 제목으로 개제 예정입니다. -
Academic Advisor네이버 커넥트재단 Jan 2024 - Feb 2024Seongnam, Gyeonggi, South KoreaAI 엔지니어 교육 기초다지기 제1회 프로젝트 참여. 20명의 훈련생을 담당하여 기술 및 운영관련 질의 응답. 훈련생 프로젝트 검수 및 피드백하였습니다. -
Undergraduate Student ResearcherSoongsil University Mar 2023 - Dec 2023Seoul, South Korea한국어 Automatic fact-checking을 연구하였습니다.Automatic fact-checking의 선행 연구는 데이터의 의존성이 큰 주제로 전문가의 진위여부 데이터가 필요한 분야이기도 합니다. 이는 저자원언어가 될 수 있는 환경에서는 연구 주제의 확장성이 떨어지는 것을 발견하였습니다.이를 해결하기 위해 wikipedia language tool을 활용하여 sentence similarity기반 Pseudo-labeling을 제안하였습니다. 이렇게 수집된 데이터를 cross-lingual contrastive learning으로 학습하였습니다.해당 연구를 실험하기 위해 한국어를 저자원 언어로 가정하고 ground truth data 없이 학습하여 한국어 자동화 팩트체크 데이터셋에 저희 방법론을 평가하였습니다. 그 결과 ground truth 없이 학습한 결과는 학습한 결과 대비 4%라는 근소한 차이를 가져왔습니다. -
Ai Engineering Trainee부스트캠프 (Boostcamp) Sep 2022 - Feb 2023Seongnam, Gyeonggi, South KoreaDL/ML 기반 End-to-End 로직에 필요한 엔지니어링 기술 학습, 자연어 처리(NLP) 특화 경진대회 및 자유 주제 프로젝트 진행.최종 프로젝트[주제] : 수시로 확인이 어려운 오픈채팅방 요약 서비스- 장기적으로 확인하지 않아 유령회원으로 남게되는 오픈채팅방에서 원하는 주제를 기반으로 대화 내용을 선별 및 요약해주는 서비스가 필요하다고 판단하여 진행하게 되었습니다.[핵심 아이디어] : long-term의 채팅 요약 시스템 개발을 위해 Topic segmentation 및 Summarization 모델 개발.[역할] : 아키텍처 설계, Topic Segmentation model 개발, 프론트엔드 개발아이디어를 지속적으로 점검하며 제공하는 서비스 개발에 적합한 모델을 지속적으로 논의 및 클라우드 환경하기 위한 아키텍처에 대해 지속적으로 회의를 진행했습니다. 본 과정을 통해 AI 모델을 모듈화 및 전체 서비스 개발을 해보며 AI 기반 서비스 설계에 대해 이해를 갖추었습니다.
Frequently Asked Questions about 김한성
What company does 김한성 work for?
김한성 works for Pwc
What is 김한성's role at the current company?
김한성's current role is Research Assistant.
What schools did 김한성 attend?
김한성 attended 숭실대학교.
Who are 김한성's colleagues?
김한성's colleagues are Erwin Nisperos, Amy Farlie, Sai Akhil, Abin P., Liam Smith, Helmut Artinger, Samantha Vidler - Pwc Queensland Managing Partner.
Not the 김한성 you were looking for?
Free Chrome Extension
Find emails, phones & company data instantly
Aero Online
Your AI prospecting assistant
Select data to include:
0 records × $0.02 per record
Download 750 million emails and 100 million phone numbers
Access emails and phone numbers of over 750 million business users. Instantly download verified profiles using 20+ filters, including location, job title, company, function, and industry.
Start your free trial