본문 바로가기

전체 글

(95)
Patch Extraction: CT 의료 영상 데이터로 실습해보기 Python 코드: 데이터 불러와서 patch extraction 진행import osimport globimport numpy as npimport imageiofrom torch.utils.data import Dataset# 원본 이미지가 512*512이고, patch size는 64*64, stride = 32 이므로 총 225개가 나와야 함class MayoCTDenoisingDataset(Dataset): def __init__(self, full_dir, quarter_dir, is_train = True, patch_size=64, stride=32): # 하위 폴더 포함 전체 .tiff 파일 찾기, sorted로 순서 맞추기 self.full_paths =..
Patch Extraction 구현 하기: 기초 512x512 해상도를 가진 이미지를 여러 64x64 해상도의 패치로 자르는 Patch Extraction 모듈을 구현해봅시다.이번 실습에서는 512x512 resolution의 이미지를 patch size는 64x64, stride = 32로 진행해볼거에요.즉, 하나의 원본 이미지에서 15의 제곱, 225개의 겹치는 patch들이 추출됩니다.import osimport globimport numpy as npimport imageiofrom torch.utils.data import Datasetimport osimport globimport imageioimport numpy as npimport torchfrom torch.utils.data import Datasetclass PNG_Dataset..
Markov Chain 마르코프 체인 Markov 성질을 지닌 이산확률과정*Markov 성질?→ 현재 N회의 상태가 미래 N+1회의 상태에 영향을 주는 유일한 정보즉, 과거 상태는 무시하고 오직 현재 상태만 고려해서 다음 상태의 확률을 계산하는 것⇒ 과거와 현재 상태가 주어졌을때, 미래 상태의 조건부 확률 분포가 과거 상태와 독립적으로 현재 상태의 의해서만 결정되는 것 *이산확률과정 Discrete Stochastic Process?→ 이산적으로 관측되는 시간 T를 축으로 하는 확률 변수의 집합,즉, 이산적인 시간의 진행에 대해 확률적인 변화를 가지는 구조 Markov Chain 이해를 위한 예시(1) 동전 앞뒤 예측동전을 던졌을때 앞면이 나오거나 뒷면이 나올 확률은 독립시행이므로n번째 상태가 n+1 번째 상태에 영향을 줄 수 없음⇒ 마르코..
OCR 기반 데이터 수집 및 구조화 과정 정리 OCR 기반 데이터 수집 및 구조화폴더 명: data_extraction▶ 목적육아 도서 및 자료 스캔본(PDF)을 구조화된 문단 데이터로 추출하여 RAG 기반 서비스의 참고 데이터로 활용 가능하도록 가공제공 서비스 :RAG 기반 GPT Chatbot에서 참고할 수 있는 육아 문서 기반 데이터 구축육아 워크북 생성 시 참고할 수 있는 육아 문서 기반 데이터 구축 ▶ 해당 기능의 핵심 기술 요소 및 소프트웨어 패키지Google Cloud Vision API: PDF OCR 처리https://cloud.google.com/vision/docs/pdfGCS(Google Cloud Storage)에 업로드된 PDF를 OCR 처리하고, GCS에 JSON 결과로 저장Google Cloud Storage (GCS):..
육아 문서 기반 챗봇 구현 과정 정리 GPT 기반 조언 챗봇폴더 명: chatbot▶ 목적사용자의 자연어 질문에 대해, 관련 잇는 육아 데이터와 사용자 정보를 기반으로 하여 맞춤형 GPT 답변 생성제공 서비스 :육아 Q&A 챗봇 서비스: 질문자에게 신뢰 기반 + 개인 맞춤형 조언 제공 ▶ 해당 기능의 핵심 기술 요소 및 소프트웨어 패키지Sentence-BERT (SBERT): 질문/문서 임베딩https://huggingface.co/snunlp/KR-SBERT-V40K-klueNLI-augSTS사용자 질문과 문단을 벡터화하여 유사도 검색 가능하도록 변환FAISS: 유사도 검색https://github.com/facebookresearch/faiss벡터 간 cosine 유사도 기반으로 top-k 문단 검색OpenAI GPT API: 답변 생성..
양팔저울(DFS) 무게가 서로 다른 K개의 추와 빈 그릇이 있다. 모든 추의 무게는 정수이고, 그릇의 무게는 0으로 간주한다. 양팔저울을 한 번만 이용하여 원하는 물의 무게를 그릇에 담고자 한다. 주어진 모든 추 무게의 합을 S라 하자. 예를 들어, 추가 3개이고, 각 추의 무게가 {1, 2, 6}이 면, S=9이고, 양팔저울을 한 번만 이용하여 1부터 S사이에 대응되는 모든 무게의 물을 다음과 같이 그릇에 담을 수 있다. X는 그릇에 담는 물의 무게이고, ⎕은 그릇을 나타낸다.  만약 추의 무게가 {1, 5, 7}이면 S=13이고, 그릇에 담을 수 있는 물의 무게는 {1, 2, 3, 4, 5, 6, 7, 8, 11, 12, 13}이고, 1부터 S사이에서 무게에서 9와 10에 대응하는 무게의 물을 담을 수 없다. K(3 ..
휴가(삼성 SW역량평가 기출문제) 카운셀러로 일하고 있는 현수는 오늘부터 N+1일째 되는 날 휴가를 가기 위해서, 남은 N일 동안 최대한 많은 상담을 해서 휴가비를 넉넉히 만들어 휴가를 떠나려 한다. 현수가 다니는 회사에 하루에 하나씩 서로 다른 사람의 상담이 예약되어 있다. 각각의 상담은 상담을 완료하는데 걸리는 날 수 T와 상담을 했을 때 받을 수 있는 금액 P로 이루어져 있다. 만약 N = 7이고, 아래와 같이 예약이 잡혔다면 1일에 잡혀있는 상담은 총 4일이 걸리며, 상담했을 때 받을 수 있는 금액은 20이다. 만약 1일에 예약된 상담을 하면 4일까지는 상담을 할 수가 없다. 하나의 상담이 하루를 넘어가는 경우가 많기 때문에 현수는 예약된 모든 상담을 혼자 할 수 없어 최대 이익이 나는 상담 스케쥴을 짜기로 했다. 휴가를 떠나기 ..
최대점수 구하기(DFS) 이번 정보올림피아드대회에서 좋은 성적을 내기 위하여 현수는 선생님이 주신 N개의 문제를 풀려고 합니다. 각 문제는 그것을 풀었을 때 얻는 점수와 푸는데 걸리는 시간이 주어지게 됩니다. 제한시간 M안에 N개의 문제 중 최대점수를 얻을 수 있도록 해야 합니다. (해당문제는 해당시간이 걸리면 푸는 걸로 간주한다, 한 유형당 한개만 풀 수 있습니다.)  ▣ 입력설명 첫 번째 줄에 문제의 개수N(1두 번째 줄부터 N줄에 걸쳐 문제를 풀었을 때의 점수와 푸는데 걸리는 시간이 주어집니다.  ▣ 출력설명 첫 번째 줄에 제한 시간안에 얻을 수 있는 최대 점수를 출력합니다.  ▣ 입력예제 5 20 10 5 25 12 15 8 6 3 7 4  ▣ 출력예제 41내가 쓴 코드import syssys.stdin = open("i..