데브코스/실습 & 프로젝트

✅ 개요이전 포스트에서는 생성된 질문의 중복여부를 검증하기 위한 텍스트 임베딩 모델을 조사하고 결정하였다.그런데 여기서 고려해야할 한가지 문제가 있다.질문들은 매일 6개씩 새로 생겨 누적된다. 질문의 중복을 검증하려면 이전의 생성된 모든 질문들을 텍스트 임베딩 모델을 돌려야하는데 서비스가 유지될 수록 그 비용이 배로 늘어갈 것이다. 따라서 생성된 질문들의 벡터값을 별도로 저장할 수 있는 곳이 필요하다.   1. RDBMS? -> ❌현재 프로젝트에서는 RDBMS로 MySQL을 사용하고 있다. 따라서 질문들의 벡터값을 MySQL에 저장한다면 데이터 일관성과 접근성을 높인다는 장점이 있다.하지만 텍스트 임베딩을 통해 만들어진 벡터는 상당한 고차원 데이터이다. 이번 프로젝트에서 사용하는 OpenAI의 text-..
✅ 개요생성형 AI는 하루에 하나씩 각 카테고리별로 질문을 생성한다. 하지만 매일 비슷한 질문만 노출되면 서비스의 매력도가 떨어질 것이다. 따라서 생성된 질문에 대해 중복성을 검증해주는 부분이 필요하다. ✅ 텍스트 임베딩 모델질문의 중복을 검증할 때, 단순히 단어의 중복만을 고려한다면 중복을 완전히 판별하기 어려울 것이다. 따라서 단어 자체를 넘어 문장의 의미까지 판단해줄 수 있는 솔루션이 필요하다.이를 위해 텍스트 임베딩 모델을 고려했다.텍스트 임베딩 모델이란, 텍스트를 특정 차원의 벡터로 변환해주는 모델을 말한다.해당 벡터는 단순히 단어 간의 유사성 뿐만 아니라 문장의 맥락, 구조, 의미를 통합적으로 반영한다. ✅ 텍스트 임베딩 모델 선정💡 API 형식으로만 고려시중에는 수많은 텍스트 임베딩 모델이..
✅ 개요이번 프로젝트에서는 6가지 카테고리(여행, 스포츠, 패션, 문화, 맛집, 기타)에 대해 하루에 한 개씩 새로운 질문을 받아볼 수 있어야 한다는 요구사항이 존재한다.이때 질문 생성은 생성형 AI를 활용하기로 하였다. 현재 시중에는 수 많은 생성형 AI 모델이 존재한다. 이 모델들은 각기 다른 성능, 가격을 가지고 있기 때문에 어떤 모델이 현재 프로젝트에 적합한지 비교하는 과정이 필요하다.  지금부터 시중에서 가장 많이 사용되고 있는 여러가지 모델들을 비교해 프로젝트에 적합한 모델을 선별해 내도록 하겠다. ✅ AI 후보군✔️ 선정 기준시장 점유율Top3 회사의 상위 모델과 보급형 모델 1개씩 선정참고링크: https://www.economidaily.com/view/20241121182051600?u..
✅ 도입계기예전에 학교에서 프로젝트를 진행하면서 잠시나마 Jira를 사용해본적이 있었다. 그때는 왜 사용하는지는 잘 몰랐고 그저 실무에서 많이 사용한다는 조원의 추천을 통해 사용을 해보게 되었다.사용하면서 나름 편리하다는 생각을 했었다. 하지만 그 프로젝트에서 사정상 나오게 되었고 아쉬움이 남았었다. 이번 최종 프로젝트는 백엔드뿐만 아니라 프론트엔드와 디자인팀까지 함께 구성된 팀으로 진행된다. 이렇게 서로 다른 배경지식을 가진 사람들이 모였을 때, 최고의 협업 방법은 자주 소통하며 각자의 작업 현황을 신속하게 공유하는 것이라고 생각한다. 또한, 팀원 모두가 이제 막 커리어를 시작한 개발자들로, 실수가 잦고 프로젝트 요구사항이 자주 변경될 가능성이 높다고 예상된다. 이러한 이유로 Agile 프로젝트 관리 ..
jaehee1113
'데브코스/실습 & 프로젝트' 카테고리의 글 목록 (3 Page)