Evaluation | allainews.com

March 14, 2023, 7:46 p.m. | LangChain

LangChain blog.langchain.dev

Evaluation of language models, and by extension applications built on top of language models, is hard. With recent model releases (OpenAI, Anthropic, Google) evaluation is becoming a bigger and bigger issue. People are starting to try to tackle this, with OpenAI releasing OpenAI/evals - focused on evaluating OpenAI models.

anthropic applications bigger evals evaluation extension google issue language language models openai people releases

More from blog.langchain.dev / LangChain

[Week of 4/15] LangChain Release Notes 1 day, 6 hours ago | blog.langchain.dev

application cost hearing langchain +8

Tool Calling with LangChain 1 week, 1 day ago | blog.langchain.dev

api langchain llm standard +1

Rethinking Our Documentation 2 weeks ago | blog.langchain.dev

community contributors documentation growth +5

LangSmith: Production Monitoring & Automations 2 weeks, 3 days ago | blog.langchain.dev

ai assistant applications assistant automations +10

LangFriend: a Journal with Long-Term Memory 3 weeks, 1 day ago | blog.langchain.dev

app build concept concepts +7

Open Source Extraction Service 3 weeks, 3 days ago | blog.langchain.dev

application case data documents +10

[Week of 3/18] LangChain Release Notes 4 weeks ago | blog.langchain.dev

application applications data feedback +10

Using Feedback to Improve Your Application: Self Learning GPTs 4 weeks, 2 days ago | blog.langchain.dev

app application applications demo +7

LangChain Integrates NVIDIA NIM for GPU-optimized LLM Inference in RAG 1 month ago | blog.langchain.dev

adoption applications attention by langchain +16

Senior Machine Learning Engineer (MLOps)

@ Promaton | Remote, Europe

View on ai-jobs.net

Lead Software Engineer - Artificial Intelligence, LLM

@ OpenText | Hyderabad, TG, IN

View on ai-jobs.net

Lead Software Engineer- Python Data Engineer

@ JPMorgan Chase & Co. | GLASGOW, LANARKSHIRE, United Kingdom

View on ai-jobs.net

Data Analyst (m/w/d)

@ Collaboration Betters The World | Berlin, Germany

View on ai-jobs.net

Data Engineer, Quality Assurance

@ Informa Group Plc. | Boulder, CO, United States

View on ai-jobs.net

Director, Data Science - Marketing

@ Dropbox | Remote - Canada

View on ai-jobs.net