Hanyang Univ. 25-02
25년 2학기
[Week 13] Random Forest 예제 코드
[Week 11] Random Forest
(Random Forest Training and Interpretation)랜덤 포레스트는 비선형 머신러닝 모델 중에서도 안정성과 해석력의 균형이 좋은 알고리즘으로, 데이터가 많지 않은 상황에서도 높은 예측 성능을 보입니다.1️⃣ 개념 요약여러 개의 결정 트리(Decision Trees) 를 만들어, 각 결과를 평균(회귀) 또는 투표(분류) 로 결합하는 앙상블 모델Bagging(Boots…
[Week 11] 데이터 분석 전체 프로세스
(End-to-End Machine Learning Workflow)머신러닝 프로젝트는 단순히 모델을 만드는 일이 아니라, 데이터를 문제 해결에 맞게 가공하고 검증하는 전체 프로세스의 관리가 핵심입니다.1️⃣ 문제 정의 (Problem Definition)예측 대상(y) 과 입력 변수(X) 를 명확히 설정합니다.예: 매출 예측, 불량품 판정, 고객 이탈 예측 등문제의 유형을 파악합니다.회귀…
[Week 10] Streamlit
1. 텍스트 기능 (Text Elements)함수설명st.write()텍스트, 데이터, 차트 등 만능 출력st.markdown()마크다운 + HTML 지원st.title(), st.header()제목 계층 구조공식 문서 섹션: Text elements2. 테이블 기능 (Data Display)함수설명st.dataframe()인터랙티브 테이블 (정렬·필터)st.table()정적 테이블 (고정…
[Week 8] AI OCR 기술 개요
OCR 기술 흐름전통 OCR: Tesseract(Google, 2006~)은 LSTM 기반으로 100+ 언어 지원, CPU 실행(수 MB 메모리). 문자 인식에 특화, CER 10-20%(인쇄물), 30-50%(손글씨). 복잡한 레이아웃(표, 다단) 처리 약함.멀티모달 LLM: 2020년대부터 GPT-4V(ChatGPT), Gemini 등 등장. 이미지 전체 분석, 자연어 쿼리(예: "총매…
[Week 7] Condition Agent Node
기능이 노드는 대화형 AI(LLM)를 사용해 워크플로우를 유연하게 분기시킵니다. 사용자가 미리 정한 "시나리오"(가능한 상황이나 분류)를 기반으로, 자연어로 작성된 "지침"에 따라 입력된 내용을 분석해 어떤 경로로 갈지 결정합니다. AI가 이 분석 결과에 따라 워크플로우를 적절한 출력 경로로 보내줍니다. 이 노드는 단순한 규칙으로는 해결하기 어려운 사용자 의도 파악, 복잡한 분기, 또는 섬…
[Week 7] Tokenizer
1. 텍스트 → 토큰 (Tokenizer 단계)**토크나이저(tokenizer)**는 “문장을 모델이 이해할 수 있는 단위(토큰)”로 쪼개는 역할을 합니다.예를 들어:"로봇이 움직인다."→ ["로", "봇", "이", " ", "움", "직", "인", "다", "."]이 각각이 **토큰(token)**입니다.영어의 경우 "robot is moving." → ["robot", " is", …
[Week 5] PDF Loader
1. PDF Loader 개요역할: PDF 파일을 Flowise에 불러와 Document 객체로 변환.활용 단계: Loader → Text Splitter → Embedding → Vector Store 업서트2. 처리 모드 (Processing Modes)모드설명장점단점활용 추천Per Page각 PDF 페이지를 개별 문서로 처리페이지 기반 검색 및 페이지 번호 메타데이터 활용 가능페이지…
[Week 4] RAG
1. RAG란?RAG(Retrieval-Augmented Generation)는 **검색(Retrieval)**과 **생성(Generation)**을 결합한 AI 기술로, LLM(Large Language Model)의 Hallucination(부정확하거나 가상의 답변 생성)을 줄이고 정확한 답변을 제공합니다.검색 단계: 질문과 관련된 외부 데이터(문서, DB 등)를 검색.생성 단계: 검색…
[Week 4 ] Flowise Document Loaders
https://docs.flowiseai.com/integrations/langchain/document-loaders1. 파일 기반 (File-based)File Loader – 로컬/업로드된 파일을 불러오는 기본 로더PDF Files – PDF 문서를 텍스트로 변환Docx / Microsoft Word / Excel / PowerPoint – MS Office 문서 불러오기Csv Fil…
[Week 3] Flowise LLM 노드
https://docs.flowiseai.com/using-flowise/agentflowv2#id-2.-llm-node1. 모델 설정 (Model Selection)Model설명: 사용할 언어 모델 선택. Flowise UI에서 ChatOpenAI 선택 시 OpenAI 모델 사용.옵션:gpt-4o-mini: 비용 효율적, 텍스트+이미지 처리 가능. 맥락 창 128K 토큰.gpt-5-nan…
[Week 3] Agentflow Node
https://docs.flowiseai.com/using-flowise/agentflowv2#agentflow-v2-node-reference1. 시작 노드 (Start Node)기능: 워크플로우 실행의 진입점. 모든 워크플로우는 이 노드에서 시작.역할: 워크플로우 트리거 방식과 초기 조건을 정의. 사용자 입력(채팅 또는 폼) 수신, Flow State 변수 초기화, 대화 메모리 관리 설…
[Week 2] 주요 AI 알고리즘
ML 기반 알고리즘적용 데이터: 구조화된 데이터 (숫자/범주형, 예: 엑셀, CRM), 시계열 데이터 (시간 순서, 예: 센서, 주식), 다중 데이터 (복합 형태)트리 기반의사결정나무: 단순, 해석 쉬움. 소규모 데이터 적합예: 소매점 재고 부족 예측(판매량, 계절성)최근 기업 사례 (2023-2025): 소매 산업에서 재고 부족 예측을 위해 의사결정나무를 활용한 사례. 대형 소매 기업이 …
[Week 1] 2. 가까운 미래
AI의 업무 및 일상 적용 확대특징: AI가 업무와 일상에서 광범위하게 적용되며, 자동화된 작업 수행이 표준화. 디지털 환경에서 대부분의 업무(예: 데이터 분석, 고객 응대, 콘텐츠 생성)가 AI로 처리 가능.기술적 전망:LLM API 가격 하락: 2025년 기준으로 OpenAI GPT-5 API 비용이 이전 모델 대비 50% 이상 감소, 향후 1/10 수준으로 떨어질 전망. 중소기업 및 …
[Week 1] 1. 생성형 AI 발전 동향
주요 사건 및 서비스 출시2022LangChain (2022.10): LLM 애플리케이션 개발을 위한 오픈소스 프레임워크.기술적 특징: LLM 체인, 에이전트, 메모리 등 모듈 제공으로 복잡한 AI 워크플로우 구축 가능.Perplexity AI (2022.8): AI 기반 검색 엔진으로, 질문에 대한 자연어 답변과 출처 제공.기술적 특징: 검색 결과 요약과 인용으로 정확한 정보 제공.Cha…
토픽 삭제
정말로 "Hanyang Univ. 25-02" 토픽을 삭제하시겠습니까?
이 작업은 되돌릴 수 없으며, 이 토픽에 속한 모든 포스트의 토픽 정보가 삭제됩니다.